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Avant-propos 


Tout le monde sait et dit que celui qui observe sans idée, observe en vain. 
Éléments de philosophie, Alain (1868 - 1951) 


Le recueil, le traitement et l’analyse de l’information sont au cœur de tous 
les processus de gestion et de décision. Les méthodes de description, de pré- 
vision et de décision se sont considérablement enrichies et développées, ce 
qui place la statistique appliquée! au carrefour de l’observation et de la modé- 
lisation. 


L'utilisation des méthodes statistiques s’est généralisée avec le développe- 
ment et l’interprétation de logiciels et progiciels (généralistes ou spécialisés), 
assurant la gestion des données, les calculs, les représentations graphiques… 

Plusieurs générations de logiciels statistiques 2 se sont succédé en modi- 
fiant considérablement, d’abord, l’analyse des données statistiques et main- 
tenant, l’enseignement de la statistique. Sous peine d’être noyé, non plus 
dans les calculs mais dans les résultats, l’utilisateur doit disposer d’idées pré- 
cises sur les outils, leurs fonctions et leurs champs d’application. 


Nous avons ainsi voulu guider les futurs consommateurs et utilisateurs 
de données vers les descriptions statistiques majeures et les représentations 
courantes des phénomènes rencontrés dans tous les domaines de l’activité 
humaine. 


La visualisation par tableaux et graphiques 3 est une clef indispensable 
pour traiter et comprendre efficacement les multiples ensembles de données 
statistiques ; l’usage généralisé qui en est fait pour tous les publics et par de 
nombreux médias confirme son importance. 


Dans cette sixième édition, nous avons maintenu toute notre attention sur 
les visualisations, ainsi que sur la pratique et l’utilisation du tableur Excel © 
largement répandu. 


1. À laquelle les programmes, tant de l’enseignement secondaire que de l’enseignement supé- 
rieur, accordent une place de plus en plus importante. 

2. Sans compter les versions évoluées des langages de programmation scientifique qui mettent 
l’application de traitements très sophistiqués à la portée du plus grand nombre. 

3. La représentation visuelle est remarquablement mise en valeur dans le très bel ouvrage de 
Edward R. Tufte (1991) : The Visual Display of Quantitative Information , Graphics Press, 
Cheshire, Connecticut 


AVANT-PROPOS e IX 


La théorie reste volontairement limitée pour donner toute son importance 
à l’approche interprétative des données. Le lecteur, selon ses connaissances 
préalables et son intérêt pour la formalisation, pourra en première lecture pas- 
ser outre la présentation de certains supports théoriques. Ce livre n’est qu’une 
introduction à la méthode statistique, et nous donnons quelques références 
d'ouvrages pour élargir idées et connaissances. 


Dans cette sixième édition, nous avons remis à jour, à partir des recueils 
les plus récents, les données de nombreux exemples et des exercices (com- 
plétés et enrichis). Nous avons également inclus une très brève introduction 
illustrée à la pratique et à l’usage de la simulation, outil de plus en plus incon- 
tournable dans des secteurs tels que la logistique, la stratégie, ou encore 
l’analyse financière … 


Issu de nombreuses expériences d’enseignement en formation initiale 
comme en formation continue pour des étudiants en sciences économiques, 
en sciences de gestion et en informatique de gestion, ce livre tient compte de 
leurs besoins et des dernières évolutions. Nous pensons qu’il correspond bien 
aux exigences actuelles. Nous remercions par avance les lectrices et les lec- 
teurs qui voudront bien nous faire part de leurs remarques ou suggestions. 


Bernard Goldfarb 
Catherine Pardoux 
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1. D IStributions 


statistiques 
à Un caractère 


Le savant doit ordonner ; on fait la science avec des faits 
comme une maison avec des pierres ; 

mais une accumulation de faits n'est pas plus une science 
qu'un tas de pierres n'est une maison. 


La Science et l'hypothèse, Henri Poincaré (1854-1912) 


a statistique descriptive est un ensemble de méthodes permettant 

de décrire, présenter, résumer des données souvent très nom- 

breuses. Ces méthodes peuvent être numériques (tris, élaboration 
de tableaux, calcul de moyennes...) et/ou mener à des représentations 
graphiques. 


1. Définitions 


A. Population, individu, échantillon 


Une population est l’ensemble des éléments auxquels se rapportent les don- 
nées étudiées. En statistique, le terme « population » s’applique à des ensem- 
bles de toute nature  : étudiants d’une académie, production d’une usine, 
poissons d’une rivière, entreprises d’un secteur donné... 


Des enquêtes de l’Office statistique des communautés européennes don- 
nent la durée hebdomadaire moyenne du travail des salariés à temps com- 
plet pour 15 pays membres. Les résultats de ces enquêtes ne donnent pas 
d’information « atomisée » à un niveau plus bas que le pays ; la population 
de référence n’est donc pas ici l’ensemble (plusieurs millions) de tous les 
salariés des 15 pays. L’étude de ces 15 observations concerne un ensemble 
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de 15 unités (statistiques), les 15 pays sélectionnés qui constituent la popu- 
lation de l’étude. 


Dans une population donnée, chaque élément est appelé « individu » ou 
« unité statistique ». 


La collecte d'informations sur une population peut être effectuée sur la 
totalité des individus ; on parle alors d'enquêtes exhaustives. Lorsque la 
taille de la population étudiée est élevée, de telles enquêtes sont fort coû- 
teuses ou impossibles, et le cas échéant, leurs résultats souvent très longs 
à rassembler peuvent être dépassés avant même la fin de l’enquête. C’est 
la raison pour laquelle on a souvent recours aux enquêtes par sondage qui 
portent sur une partie de la population appelée échantillon. Les observa- 
tions obtenues sur une population ou sur un échantillon constituent un 
ensemble de données auxquelles s’appliquent les méthodes de la statistique 
descriptive dont le but est de décrire le plus complètement et le plus sim- 
plement l’ensemble des observations qu’elles soient relatives à toute la 
population ou seulement à un sous-ensemble. 


B. Variables 


Chaque individu d’une population peut être décrit selon une ou plusieurs 
variables qui peuvent être des caractéristiques qualitatives ou prendre des 
valeurs numériques. 


Une variable est dite qualitative si ses différentes réalisations (modalités) 
ne sont pas numériques. Ainsi : le sexe, la situation matrimoniale, la catégorie 
socioprofessionnelle.… sont des variables qualitatives. On peut toujours rendre 
numérique une telle variable en associant un nombre à chaque modalité  ; on 
dit alors que les modalités sont codées. Bien entendu, les valeurs numériques 
n’ont dans ce cas aucune signification particulière, et effectuer des opérations 
algébriques sur ces valeurs numériques n’a pas de sens. 


Une variable est dite quantitative lorsqu'elle est intrinsèquement numéri- 
que : effectuer des opérations algébriques (addition, multiplication...) sur une 
telle variable a alors un sens. Une variable quantitative peut être une variable 
statistique discrète ou continue. 


Les variables statistiques discrètes sont des variables qui ne peuvent pren- 
dre que des valeurs isolées, discrètes. Le nombre d’enfants d’une famille, le 
nombre de pétales d’une fleur, le nombre de buts marqués lors d’une rencon- 
tre de football... sont des variables quantitatives discrètes. Le plus fréquem- 
ment, les valeurs possibles sont des nombres entiers. 


Les variables statistiques continues peuvent prendre toutes les valeurs 
numériques possibles d’un ensemble inclus dans R : le revenu, la taille, le 
taux de natalité sont des variables continues. 


2 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


La distinction entre variables quantitatives discrètes et continues peut 
paraître factice, car toute mesure est discrète en raison d’une précision tou- 
jours limitée ; et inversement, lorsqu'une variable discrète peut prendre un 
grand nombre de valeurs et que la taille de la population (ou de l’échantillon) 
étudiée est élevée, on regroupera des valeurs voisines et la variable sera, par 
extension, traitée comme une variable continue. En pratique, lorsque les 
valeurs d’une variable sont regroupées en  k classes, la variable est traitée 
comme une variable quantitative continue, mais elle peut aussi être envisagée 
comme une variable qualitative à k modalités. 


Les données dont on dispose sont les modalités ou valeurs prises par 
plusieurs variables qualitatives ou quantitatives sur les individus d’une 
population ou d’un échantillon ; pour une population d’entreprises, on peut 
disposer, par exemple, de données sur le chiffre d’affaire, le bénéfice net, 
le nombre d’employés, la masse salariale annuelle, le secteur d’activité 
principale. 


On peut, dans un premier temps, décrire chaque variable séparément, puis 
ensuite, étudier les relations ou liaisons existantes entre elles. Aïnsi, dans ce 
livre, nous envisagerons d’abord les populations statistiques décrites selon 
une seule variable, puis selon deux variables. L’étude des populations carac- 
térisées par plus de deux variables n’est pas abordée dans cet ouvrage. 


Il. Représentations graphiques 


Deux méthodes de représentation des données vont être exposées. On com- 
mencera par celles adaptées aux données nombreuses et/ou anonymes, c’est- 
à-dire pour lesquelles l’identité des individus n’a pas été relevée ou ne pré- 
sente pas d'intérêt à être conservée pour l’interprétation. Ceci n’est pas le cas 
lorsque les individus sont peu nombreux (régions, pays...), où on définira un 
nouveau mode de représentation graphique dû à J.W. Tukey ($ IL.B.). L'étude 
d’une population selon une variable sera restreinte au cas des variables quan- 
titatives, car la description d’une population selon une variable qualitative est 
totalement résumée dans un tableau de pourcentages ou dans un diagramme 
circulaire, appelé aussi diagramme en « camembert » (cf. figure 1.1). 
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Pomme de table 


Pêche et nectarine 


Autres fruits 


Extrait de Agreste, GraphAgri 2006, 
Ministère de l’Agriculture et de la Pêche. 


Figure 1.1 — Surface du verger français en 2005 


A. Distributions statistiques 
et représentations graphiques 


Considérons une variable observée sur une population P de n individus. Si 
la variable X prend k valeurs ou ensembles de valeurs (appelés dans ce qui 
suit, modalités), le premier traitement des données brutes consiste à compter 
le nombre n; d'individus qui présentent la i modalité (i = 1,2,..., k). 


1) Variables statistiques discrètes 


Les résultats concernant les observations de la variable X dont l’ensemble des 
valeurs est {x, ,i=1,..,k}, sont présentés dans le tableau des effectifs (x; , n;) 
ou dans le tableau des fréquences (x; , f;) avec f; = n;/n (on utilise souvent le 
pourcentage 100 : f). Il est préférable de calculer les fréquences à partir des 
effectifs cumulés ($ IL.A.3) afin que des erreurs successives d’arrondis ne 
donnent pas une somme totale de fréquences différente de 1. 
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Tableau des effectifs 


Modalité Effectif 
#1 da 
%: ñ. 
L L 
y n, 
k 


i=1 


Tableau des fréquences 


Modalité Fréquence 
x, J,=nn 
x; J. = nn 
Xe J,=nn 


k 
>=: 


i=1 


On présente logiquement les modalités numériques en ordre croissant. On 
peut associer à ces tableaux une représentation graphique appelée 
« diagramme en bâtons ». 


Un diagramme en bâtons (cf. figure 1.2) est construit dans un système 
d’axes rectangulaires ; les valeurs de la variable statistique X sont portées en 
abscisse ; à partir de chaque valeur x;, on trace un segment de droite vertical 
et dont la hauteur est proportionnelle à l’effectif correspondant. On peut rete- 
nir indifféremment une échelle qui explicite les effectifs 
qui explicite les fréquences f;. Pour les distributions du tableau 1.1, on pour- 
rait représenter sur le même graphique les diagrammes en bâtons de plusieurs 
pays avec des couleurs différentes, chaque couleur correspondant à un pays, 
ce qui permettrait de comparer les distributions du nombre de personnes par 


n;, ou une échelle 


ménage. 
Tableau 1.1 - Ménages suivant le nombre de personnes du ménage 
dans quelques pays en 1995 (%) 
Allemagne Espagne Finlande France Grèce Irlande Italie Pays-Bas Portugal 

Ménages de : 

— 1 personne 34,4 12,7 37,4 29,2 20,7 22,8 227 30,6 13,7 
— 2 personnes 32,3 24,5 31,0 31,8 28,9 23; 23,1 34,0 26,4 
— 3 personnes 16,0 21,8 14,4 16,8 19,8 15,6 15,6 13,4 24,7 
— 4 personnes 12,6 24,0 11,9 14,2 21,7 17,1 17,1 15,9 22,8 
— 5 personnes et plus 4,7 17,0 553 8,0 8,9 21,4 21,4 6,2 12,4 
Ensemble (en milliers) 34413 12 112 2222 23126 3756 1146 1146 6 425 3275 


Source : Tableaux de l'Économie Française 1999-2000, INSEE. 


DISTRIBUTIONS STATISTIQUES À UN CARACTÈRE € 5 


Nombre de + (%) 
personnes 30% 
1 29,2 
’) 31,8 er 
3 16,8 
4 14,2 Le 
5 ou plus 8,0 
100 1 2 83 4  5ou+ 


Figure 1.2 - Diagramme en bâtons — Nombre de personnes par ménage en France en 1995 


2) Variables statistiques continues 


L’infinité des valeurs observables ne rend pas possible la généralisation du 
diagramme en bâtons. Le domaine de variation d’une variable statistique 
continue X est partagé en k parties. L’intervalle [ x;,, x;[ fermé à gauche, 
ouvert à droite, est appelé i€ classe (i = 1,2, ...,k) ; son amplitude est égale à: 
dix; Xi: 
Il arrive que l’amplitude des classes extrêmes soit indéterminée  : la pre- 


mière classe étant définie par « moins de. », et la dernière par « plus de... » 
(cf. tableau 1.2). 


Le choix des extrémités des classes se fait à partir des données brutes ; le 
nombre & de classes doit être modéré (usuellement entre 4 et 10). Le décou- 
page en classes est assez souvent choisi tel que l’amplitude des classes soit 
constante, ou tel que les effectifs des classes soient constants (par exemple, 
10 % de la population dans chaque classe, cf. tableau 1.6). 


Le classement d’une série statistique correspond à une perte d’information 
par rapport aux données initiales puisque seuls les effectifs des classes sont 
retenus. Le travail sur une telle série impose alors l'hypothèse que les don- 
nées sont réparties uniformément à l’intérieur de chacune des classes. On 
parle aussi d’ équirépartition des individus ou encore d’ homogénéité dans 
chacune des classes. Chaque partie de la classe correspond alors à un effectif 
proportionnel à sa longueur. L’idée est, bien sûr, que chaque classe repré- 
sente une entité qui doit se distinguer par rapport aux autres classes. Comme 
précédemment, les résultats sont présentés dans un tableau d’effectifs ou de 
fréquences. On associe à un tel tableau un histogramme qui est une représen- 
tation graphique très répandue. L’histogramme est constitué de la juxtaposi- 
tion de rectangles (pour respecter l’hypothèse d’équirépartition) dont les 
bases représentent les différentes classes et dont les surfaces sont proportion- 
nelles aux effectifs des classes (cf. figure 1.3). 
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On verra par la suite qu’une difficulté du travail avec des séries classées 
est le choix des limites pour les classes extrêmes, indispensable aussi pour le 
tracé de l’histogramme. 


À la ie classe, correspond un rectangle dont la base est l'intervalle [ px | 
et dont la surface est proportionnelle à la fréquence f; (ou à l’effectif n). Si 
les classes ont toutes la même amplitude, les hauteurs des rectangles sont 
proportionnelles aux fréquences. Dans le cas où les classes sont d’amplitudes 
inégales, la hauteur du rectangle correspondant à la i° classe d’amplitude a; 
sera h; = f;/a;, La surface du rectangle représentant lai classe sera ainsi égale 
à f; 

Pour une série d’observations relatives à une variable statistique  X dis- 
crète ou continue classée, la donnée des modalités et de leurs fréquences est 
appelée « distribution statistique » de la variable X. 


Tableau 1.2 — Chômeurs BIT selon le sexe et l'ancienneté de chômage en septembre 2006 


Distribution en milliers Distribution en pourcentage 

Ancienneté d'inscription Hommes Femmes Hommes Femmes 
Moins d’un mois 180,3 181,0 16,5 16,8 
D'un à moins de trois mois 203,9 204,9 18,6 19,0 
De trois à moins de six mois 169,3 163,1 155 15,1 
De six mois à moins d’un an 202,1 191,1 18,5 17,7 
D'un à moins de deux ans 197,3 199,3 18,0 18,5 
De deux à moins de trois ans 74,5 75,4 6,8 7,0 
Trois ans ou plus 67,1 62,9 6,1 5,8 
Ensemble 1 094,5 1 077,7 100 100 
Ancienneté moyenne en jours 341 334 


Source : Bulletin Mensuel des Statistiques du Travail, wwWw.travail.sgouv.fr, octobre 2006. 
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Mois 
013 6 12 24 36 60 


Figure 1.3 — Histogramme de la distribution des chômeurs « Femmes » selon l’ancienneté 
(voir tableau 1.2) 


La classe « Trois ans ou plus » est supposée bornée supérieurement par 
5 ans (60 mois). 


3) Fréquences cumulées et courbe cumulative 


a) Tableau des fréquences cumulées 


Les tableaux de fréquences (ou d’effectifs) qui viennent d’être définis peu- 
vent être modifiés de facon à présenter un résumé des données sous une 
forme différente. 


On appelle effectif cumulé de la i classe, le nombre d’individus N. pour 
lesquels la variable prend une valeur inférieure à x. 


N;= du, pour i=1,2,..., k 
j<i 


On définit de même F;, la fréquence cumulée de la i classe: F;=N;/n 
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Les tableaux d’effectifs cumulés ou de fréquences cumulées se déduisent 
des tableaux d’effectifs ou de fréquences (non cumulés) en substituant aux 
effectifs ou fréquences non cumulés les effectifs ou fréquences cumulés. Les 
deux types de tableaux sont donc équivalents (cf. figures 1.2 et 1.4). 


b) Fonction cumulative et courbe cumulative 


La courbe cumulative ou courbe des fréquences cumulées est la représentation 
graphique des fréquences cumulées. Plus précisément, la courbe cumulative 
est la représentation graphique de la proportion F(t) des individus de la popu- 
lation dont le caractère prend une valeur inférieure à r. Cette fonction, appelée 
fonction cumulative ou fonction de répartition , est : 

1. définie pour tout 1 € R 

2. croissante (mais non strictement croissante) 

3. nulle pour f inférieur à min x; 

1<i<n 


4. égale à 1 pour f au moins égal à max x; 
1<i<n 


Pour une variable statistique discrète, cette fonction est une fonction en 
escalier, présentant en chacune des valeurs possibles x;, un saut égal à la fré- 
quence correspondante f; (cf. figure 1.4). 


Dans le cas d’une variable statistique continue, la fonction cumulative 
n’est connue que pour les valeurs de  X égales aux extrémités des classes. 
L'hypothèse d’équirépartition ($ IL.A.2) implique que la fonction F est 
linéaire entre ces valeurs ( cf. figure 1.5). Cette fonction est donc continue et 
linéaire par morceaux. Ici encore, il est nécessaire de choisir des limites pour 
les classes extrêmes. 


t F(1) (%) 
<1 0 
[1:21 29,2 
[2 ; 3[ 61,0 
[3 ; 4 77,8 
[4 ; 5[ 92,0 
>5 100 


1 2 3 4 5et+ 
Figure 1.4 - Graphe des fréquences cumulées de la distribution représentée à la figure 1.2 


Ces fréquences cumulées sont des fréquences cumulées ascendantes, car 
elles ont été obtenues en calculant les fréquences F'; d’individus pour lesquel- 
les le caractère étudié X est au plus égal à x; ; on peut aussi définir les fré- 
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t F(1) (D) 

0 0 É 

1 16.8 job 

3 35.8 

6 50,9 

12 68,7 
24 87,2 
. és 0336 12 24 36 60 
60 100 Mois 


Figure 1.5 — Courbe cumulative de la distribution représentée à la figure 1.3 


quences cumulées descendantes, c’est-à-dire les fréquences pour lesquelles 
le caractère étudié X est supérieur à x;. Quand on ne spécifie pas le type de 
fréquences cumulées, on sous-entend qu’il s’agit des fréquences cumulées 
ascendantes. 


B. Le diagramme « branche et feuille » 


Lorsque la taille de la population étudiée n’est pas trop élevée (inférieure à 

la centaine), il est intéressant d'utiliser la représentation en diagramme 
« branche et feuille » due à J. W. Tukey!. Ce diagramme tient à la fois du 
tableau et de la représentation graphique et donne une vision d’ensemble des 
données sans perdre l'information numérique valeur par valeur. 


1) Profondeur d'une observation 


Selon qu’on range les valeurs observées de la variable statistique X de la plus 
faible à la plus élevée ou de la plus élevée à la plus faible, on associe à cha- 
que observation x; deux rangs, croissant et décroissant. On dit alors que la 
distribution est ordonnée. 


On appelle profondeur de x; le nombre égal au plus petit des deux rangs. 


Les durées hebdomadaires du travail des salariés à temps complet dans les 
pays de l’Union européenne ( cf. tableau 1.3) peuvent être ordonnées, et on 
en déduit la profondeur de chaque valeur de chacune des séries. 


1.1. W. Tukey, Exploratory Data Analysis (EDA), Addison-Wesley, 1977. 
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Tableau 1.3 — Durée hebdomadaire du travail des salariés à temps complet 
dans l’Union européenne (heures) 


Allemagne 
Autriche 
Belgique 

Danemark 
Espagne 
Finlande 

France 
Grèce 
Irlande 
Italie 
Luxembourg 
Pays-Bas 
Portugal 
Royaume-Uni 
Suède 


1990 


39,9 
40,1 
38 

39 

40,7 
38,4 
39,6 
40,2 
40,4 
38.6 
39,9 
39 

41,9 
43,7 
40,7 


1995 


39,7 
393 
38,4 
39 

40,7 
38,6 
39,9 
40,3 
40,2 
38,4 
39,5 
39:5 
41,2 
43,9 
40 


2000 


40,1 
40,1 
38,5 
39,3 
40,6 
39,3 
38,9 
40,9 
39,9 
38,6 
39,8 
39 

40,3 
43,6 
40 


Source : Tableaux de l'Économie Française, INSEE. 


Le nombre de pays étant impair et égal à 15, il y a deux valeurs de pro- 
fondeur 1, 2, 3, 4, 5, 6, 7 et une seule valeur de profondeur 8 (cf. tableau 1.4). 


Tableau 1.4 — Pays ordonnés selon la durée hebdomadaire du travail des salariés 
à temps complet en 2000 


ra Fan 8 Profondeur Durée (heures) Pays 

croissant décroissant 
1 15 1 38,5 Belgique 
2 14 2 38,6 Italie 
3 13 3 38,9 France 
4 12 4 39,0 Pays-Bas 
= 11 5 39,3 Danemark 
6 10 6 39,3 Finlande 
7 9 fi 39,8 Luxembourg 
8 8 8 39,9 Irlande 
9 7 7 40,0 Suède 
10 6 6 40,1 Allemagne 
11 5 5 40,1 Autriche 
12 4 4 40,3 Portugal 
13 3 3 40,6 Espagne 
14 2 2) 40,9 Grèce 
15 1 il 43,6 Royaume-Uni 
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2) La représentation en diagramme « branche et feuille » 


Son principe consiste à distinguer deux parties pour tout nombre : les chiffres de 
plus « faible poids », la feuille, et les chiffres de plus « haut poids », la branche. 


La figure 1.6 reproduit les diagrammes « Branche et feuille » donnés par 
le logiciel SPSS pour les séries du tableau 1.3. 


1990 1995 2000 
Frequency Stem & Leaf Frequency Stem & Leaf Frequency Stem & Leaf 
3,00 38.046 3,00 38.446 0,00 38. 
5,00 39 . 00699 6,00 39.035579 3,00 38.569 
5,00 40 .12477 4,00  40.0237 3,00 39.033 
1,00 41.9 1,00 41.2 2,00 39.89 
1,00 Extrêmes (>=43,7) 1,00 Extrêmes (>=43,9) 4,00  40.0113 
2,00 40.69 
1,00 Extrêmes (>=43.6) 
Stem width : 1,0 Stem width : 1,0 Stem width : 1,0 
Each leaf : 1 case(s) Each leaf : 1 case(s) Each leaf : 1 case(s) 


Figure 1.6 — « Branche et feuille » (logiciel SPSS) pour les séries du tableau 1.3 


Par exemple, pour le diagramme de l’année 1995 de la figure 1.6, en se 
référant aux valeurs ordonnées : 


— la valeur 38,4 est représentée par la branche 38 et la feuille 4 (pour les 

deux observations) ; 

— la valeur 38,6 est représentée par la branche 38 et la feuille 6. 

Ces trois observations conduisent à l’écriture : 3,00 38. 446 

La valeur 43,9 est beaucoup plus élevée que les autres ; elle est mention- 
née comme valeur « extrême ». On verra comment une valeur est ainsi clas- 
sée ($ IV.B). Le nombre de feuilles de chaque branche donnant l’effectif, un 
histogramme à classes égales d’amplitude 1 donne une représentation simi- 
laire, mais l’avantage du diagramme branche et feuille est de conserver ici 
l'information donnée par le premier chiffre décimal, donc de garder l’infor- 
mation de la répartition à l’intérieur des classes. 

Les logiciels choisissent, selon la structure des données, des « amplitudes » 
égales à 1, 0,5 ou 0,25. La plage des valeurs étant plus restreinte en 2000 qu’en 
1990 et 1995, le logiciel SPSS a choisi des amplitudes égales à 1 pour les 
années 1990 et 1995, et des amplitudes égales à 0,5 pour l’année 2000. 

On peut compléter ce type de diagramme pour garder l’identité des indivi- 
dus en indiquant symétriquement l’identité de chaque feuille ( cf. figure 1.7). 
On pourrait aussi représenter dos à dos les distributions correspondant à deux 
années différentes pour suivre l’évolution de la durée hebdomadaire du travail. 


12 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


Frequency Stem & Leaf 


3,00 FinItBel 38.446 

6,00 Fr AI P.Bas Lux Aut Dk 39.035579 

4,00 Esp Gr Irl Suèd 40 .0237 

1,00 Por 41.2 

1,00 R-U  Extremes (> = 43,9) 


Stem width : 1,0 
Each leaf : 1 case(s) 


Figure 1.7 — Diagramme « Branche et feuille > complété par l'identité des pays (1995) 


I. Les indicateurs statistiques 


Le tableau de distribution d’une variable statistique présente l’information 
recueillie sur cette variable. Une représentation graphique en fournit un por- 
trait pour appréhender plus facilement la globalité de l’information. On peut 
désirer aller plus loin en cherchant à caractériser la représentation visuelle 
par des éléments synthétiques sur : 


e la valeur de la variable située au « centre » de la distribution : la ten- 
dance centrale et, plus généralement, un indicateur de position non 
nécessairement centrale, liée à un rang donné ; 


° la variation des valeurs : la dispersion ; 
° la forme de la distribution ; 
° les aspects particuliers : valeurs extrêmes, groupes de valeurs. 


Ces indicateurs étant exprimés dans les unités de la variable étudiée, on 
verra qu’il peut être intéressant pour comparer plusieurs distributions entre 
elles de calculer des caractéristiques de dispersion relative. 


A. Conditions de Yule 


Le statisticien britannique Yule ! a énoncé un certain nombre de propriétés 
souhaitées pour les indicateurs des séries statistiques  ; ceux-ci doivent être 
d’une part, des résumés « maniables » et d’autre part, les plus exhaustifs pos- 
sibles relativement à l’information contenue dans les données. 


1. G. Udny Yule et M. G. Kendall, An Introduction to the Theory of Statistics, Charles Griffin 
& Co, 14° édition, 1950. 
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Dans son schéma, une caractéristique statistique doit être une valeur-type 

1. définie de façon objective et donc indépendante de l’observateur ; 

2. dépendante de toutes les observations ; 

3. de signification concrète pour être comprise par des non-spécialistes ; 

4. simple à calculer ; 

5. peu sensible aux fluctuations d’échantillonnage ; 

6. se prêtant aisément aux opérateurs mathématiques classiques. 

En réalité, on ne dispose pas de caractéristiques répondant simultanément 
à ces six conditions. Le choix d’un indicateur sera l’objet d’un compromis 
guidé par la spécificité de l’étude en cours. 


B. Les indicateurs de tendance centrale et de position 


Selon l’usage courant, toutes les mesures de tendance centrale méritent le 
nom de « moyenne ». Lorsqu'on parle de moyenne, on pense à la moyenne 
arithmétique ; mais il existe d’autres types de moyennes, chacune d’entre 
elles ayant la propriété de conserver une caractéristique de l’ensemble quand 
on remplace chaque élément de l’ensemble par cette valeur unique ; chaque 
moyenne n’a donc d'intérêt que pour autant que cette propriété soit utile !. 

Les « moyennes » sont des valeurs abstraites qui, sauf par hasard, ne cor- 
respondent à aucune réalisation concrète. 


1) La moyenne arithmétique 


On appelle moyenne arithmétique la somme de toutes les données statistiques 
divisée par le nombre de ces données. La moyenne arithmétique conserve la 
somme totale des valeurs observées : si on modifie les valeurs de deux obser- 
vations d’une série statistique tout en conservant leur somme, la moyenne de 
la série sera inchangée. 

Soit la série statistique de données brutes : x,,...,x;, ..., X,, Sa moyenne 
arithmétique a pour expression : 


n 
end x 
ni 
Bien entendu, si une valeur x; de X estobservée n; fois, comme 
X;+X;+...+x;=n;x;, la formule précédente devient : 
——— À ————— 
n; fois 


1. Ch. Antoine, « Les moyennes au quotidien », dans Les Moyennes, Que Sais-je, PUF, n° 3383, 
1998, p. 107. 
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N — ne n; 
où k désigne le nombre de valeurs distinctes de X et f, = — 
n 


Lorsqu'on a une variable statistique continue, on ne connaît pas les valeurs 
exactes prises par la variable, mais seulement le nombre d’observations à 
l’intérieur de chaque classe. Pour calculer la moyenne arithmétique d’une 
telle variable, on ramène chaque observation au centre de sa classe, ceci en 
raison de l’hypothèse d’équirépartition à l’intérieur des classes, et celà revient 
à considérer la moyenne des individus de la i° classe égale à (x; ,+ x;)/2. 


Dans le cas des classes extrêmes non limitées, le choix des limites de ces 
classes influe évidemment sur la valeur de la moyenne arithmétique. Ces 
limites devront être choisies en fonction des connaissances sur les données 
et en n’oubliant pas l’hypothèse de base  : l’homogénéité à l’intérieur des 
classes. Pour une classe extrême dans laquelle on sait qu’il n’y a pas équiré- 
partition, les observations étant vraisemblablement en majorité regroupées 
sur une partie de la classe, il conviendra de choisir la borne extrême 


° moins faible que la borne réelle (supposée) s’il s’agit de la première 
classe ; 


* plus faible que la borne réelle (supposée) s’il s’agit de la dernière classe. 


C’est ce qui a été fait pour la série présentée au tableau 1.2 et à la figure 1.3, 
l’ancienneté moyenne du chômage a été considérée égale à 48 mois pour ceux 
dont l’ancienneté était au moins égale à 36 mois et la borne supérieure de la 
dernière classe a été de ce fait fixée à 60 mois (l’hypothèse d’équirépartition 
amène à considérer que la moyenne des observations d’une classe est égale au 
centre de la classe). 


Propriétés 


1. La moyenne est une caractéristique qui satisfait à toutes les conditions 
de Yule, sauf à la conditions 5 : une observation « extrême » (exceptionnel- 
lement élevée ou faible) peut avoir une forte incidence sur sa valeur. 


2. La somme algébrique des écarts des valeurs d’une variable statisti- 


k 
que à sa moyenne arithmétique est nulle : », f(x; -X) = 0 
i=l 

3. Lorsqu'on fait subir à une variable statistique X une transformation 
affine, c’est-à-dire un changement d’origine et d’unité { Y = aX + x}, sa 
moyenne arithmétique subit la même transformation : ÿ = aX+x, 

4. Soit une population P de taille n partagée en deux sous-populations 
P, de taille n, et P, de taille n.. 

Soit X, une variable statistique observée sur la population PP, on peut 
exprimer sa moyenne x en fonction de ses moyennes x; sur P, et x; sur 
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P, en remarquant que la somme totale nx s'obtient en additionnant 
niX; et MX : 


X = Lx + X) 
n 


Ce résultat se généralise à une partition en k sous-populations (k > 2) : 
k 
Il = 
X = - n;X; 
2 


D Exemple 
L’ancienneté moyenne d’inscription au chômage pour hommes et femmes 
réunis en septembre 2006 est égale à (cf. tableau 1.2 pour les données) : 


x = —1_(1094,5. 341 + 1 077,7. 334) = 338 jours 
21722 


2) D'autres moyennes 


a) La moyenne géométrique 
C’est la moyenne applicable à des mesures de grandeurs dont la croissance 
est géométrique ou exponentielle. 

La moyenne géométrique conserve le produit des x ;: si on modifie les 
valeurs de deux observations tout en conservant leur produit, la moyenne 
géométrique sera inchangée. 

La moyenne géométrique G de la série de valeurs x;, .…,x;,..…., x, Sup- 
posées toutes positives (strictement), est définie ainsi : 


Lorsque la distribution de la variable statistique est donnée par les k couples 
(x;,n;), les x; étant tous positifs ; la moyenne géométrique a pour expression : 


Ÿ fin(x) 


i=1 


D Exemple 
Supposons que pendant une décennie, les salaires aient été multipliés 
par 2 et que pendant la décennie sui vante, ils aient été multipliés par 4 ; 
le coefficient multiplicateur moyen par décennie est égal à : 


2-4 = ,/8-2,83 


La moyenne arithmétique (= 3) n’est pas égale au coefficient demandé. 
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Prenons, par exemple, un salaire de 300 € au début de la première décennie, 
il sera de 300 -2:4=2 400 € au bout des vingt ans, ce qui équi vaut à 
300 : (2,83), soit un coefficient multiplicateur moyen de 2,83 par décennie. 


b) La moyenne harmonique 


La moyenne harmonique est l'inverse de la moyenne arithmétique des inverses 
des valeurs. L’inverse de la moyenne harmonique conserve ainsi la somme des 
inverses des x; : si on modifie les valeurs de deux observations tout en conser- 
vant la somme de leurs inverses, la moyenne harmonique sera inchangée. 


1 


H=7 ou H= — 
. li 
: > 1 
i=i 
La moyenne harmonique peut être utilisée lorqu’il est possible d’attribuer 
un sens réel aux inverses des données en particulier pour les taux de change, 


les taux d’équipement, le pouvoir d’achat, les vitesses. Elle est notamment 
utilisée dans les calculs d”’ indices. 


D Exemple 
On achète des dollars une première fois pour 100<€ au cours de 1,23 € le 
dollar, une seconde fois pour 100 € au cours de 0,97 € le dollar. 
Le cours mo yen du dollar pour l’ensemble de ces deux opérations est 


égal à : 

200 _ 085€ 

100 ; 100 

1,23 0,97 
La moyenne arithmétique (= 1,1) ne représente pas le cours mo yen du 
dollar. 


Comparaison des 3 moyennes étudiées 
On montre que si les x; sont tous positifs : 
min x; <H£<G<X < max x; 
ISi<n I<i<n 
L'égalité de deux de ces moyennes entre elles entraîne leur égalité dans 
leur ensemble, et dans ce cas, toutes les valeurs x; sont égales. 


3) Le mode 


Pour obtenir une mesure de la tendance centrale non influencée par les 
valeurs extrêmes de la distribution, on peut prendre la valeur — ou la classe 
de valeurs — du caractère pour laquelle le diagramme en bâtons — respective- 
ment l’histogramme — présente son maximum : c’est le mode — respectivement 
l'intervalle modal — de la distribution ; dans le cas où le diagramme en bâtons 
— ou l’histogramme — présente aussi un maximum local, il y a deux modes — 
respectivement deux classes modales. 
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Lorsque la variable statistique est discrète, le mode se définit donc à l’aide 
du tableau de distribution ou du diagramme en bâtons. Pour la distribution 
présentée à la figure 1.2, le mode est égal à 2. Si la fréquence maximum cor- 
respond à deux valeurs successives de la variable, il ya un intervalle modal. 


Lorsqu'une distribution présente plusieurs modes auxquels correspondent 
(généralement) des fréquences différentes, c’est souvent l’indice du mélange 
de deux ou plusieurs populations ayant chacune leur mode propre 
(cf. figure 1.8). Un exemple peut en être la distribution des pointures de 
chaussures des hommes et femmes réunies. 


Lorsque la variable statistique est continue, la classe modale est la classe 
dont la fréquence par unité d’amplitude est la plus élevée. Pour la distribution 
présentée à la figure 1.3, la classe modale est la classe [1, 3[. Mais cette 
détermination n’est absolument pas précise, car elle dépend du découpage en 
classes retenu ; son intérêt est limité par cette imprécision. 


Dans le cas d’une distribution discrète, le mode satisfait aux conditions 1, 
3, 4 et 5 de Yule. Dans le cas de la distribution du nombre d’enfants par 
famille, le mode est réellement une valeur typique et paraît mieux correspon- 
dre à la réalité que la moyenne arithmétique qui est rarement un nombre 
entier et qui est sensiblement influencée par un nombre relativement petit de 
familles très nombreuses. À l’inverse de la moyenne arithmétique, le mode 
néglige délibérement la précision numérique au profit de la représentativité. 
Dans un tel cas, il est souvent souhaitable de disposer de ces deux mesures 
de la tendance centrale. 


Le mode, historiquement l’un des premiers paramètres de position utili- 
sés, est un peu moins employé aujourd’hui. 


1% mode / \__2® mode 


Figure 1.8 — Exemple de distribution bimodale 
d’une variable discrète 
4) La médiane et les quantiles 


Bien qu’homogènes dans leur composition, de nombreuses distributions pré- 
sentent de très grands écarts entre les valeurs extrêmes de leurs éléments. 


De plus, elles ont souvent un manque de symétrie prononcé, les éléments 
ayant tendance à s’agglomérer plus près d’un extrême que de l’autre. Les 
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distributions de salaires ou de revenus en donnent des exemples typiques 
Il est évident que, dans de tels cas, nous avons besoin d’une mesure de la 
tendance centrale qui ne soit pas influencée par un nombre relativement petit 
de valeurs extrêmes se situant en « queue » de la distribution. 


a) La médiane 


La médiane est la valeur de la variable statistique telle qu’il y ait autant 
d'observations supérieures et d’observations inférieures à cette valeur. Elle 
partage la série statistique en deux parties d’égal effectif. Elle se détermine 
soit à partir de la série des valeurs ordonnées, soit à partir de la fonction 
cumulative ($ IL. A.3). 


Pour les variables statistiques discrètes , la médiane est déterminée à 
l’aide de la « profondeur ». 


Dans le cas où la série comporte un nombre impair  n d’observations, la 
médiane est égale à la valeur de profondeur maximum ( + 1)/2 : pour la série 
des 15 valeurs du tableau 4, la médiane est égale à la valeur de profondeur 
8, soit 39,9 H. 


Dans le cas où la série comporte un nombre pair n d’observations, la 
médiane est la moyenne arithmétique des deux valeurs de profondeur n/2 et 
est ainsi définie comme la valeur de profondeur ( n + 1)/2. 


La médiane est ainsi dans tous les cas la valeur de profondeur (n + 1)/2. 


Lorsque les données d’une variable statistique discrète sont classées, il 
n'existe généralement pas une valeur médiane Me pour laquelle la fonction 
cumulative vaut 50 %. Il faut dans ce cas utiliser d’autres valeurs typiques 
pour caractériser la tendance centrale de la série : ceci est le cas pour la dis- 
tribution du nombre de personnes par ménage dont la fonction cumulative est 
représentée à la figure 1.4. 


Pour les variables statistiques continues , la valeur médiane Me est 
telle que F(Me) = 50%. On commence par chercher la classe médiane à 
l’aide des fréquences cumulées, la classe médiane [x;_,, x;[ étant telle que 
F;,_<50% et F;,> 50%. La valeur de la médiane s’obtient ensuite par inter- 
polation linéaire en raison de l’hypothèse d’équirépartition à l’intérieur des 
classes. Cette détermination peut se faire par le calcul ou graphiquement 
(cf. figure 1.9) : 

= = > Me=x; ;+(x-xi ;): ___— 
Xj— Xi: J; 4 

Pour la distribution de l’ancienneté du chômage des femmes (tableau 1.2 

et figure 1.5), la médiane appartient à la classe [3 ; 61 : 


50 — 35,8 
15,1 


Me = 3+3: = 5,8 mois 
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Xi Me Xi 


Figure 1.9 — Détermination graphique de la médiane pour une variable continue 


La médiane peut aussi être déterminée à partir de la courbe des fréquences 
cumulées comme l’abscisse du point d’ordonnée 50 %. 


Une seule observation très élevée (ou très faible) peut influencer fortement 
la moyenne, alors que la médiane peut supporter sans être modifiée qu’une 
moitié des observations soit très élevée (ou très faible) : on dit que la médiane 
est résistante. La médiane satisfait aux conditions 1, 3, 4 et 5 de Yule. 


Dans le cas de distribution unimodale, la médiane est fréquemment com- 
prise entre la moyenne arithmétique et le mode, et plus près de la moyenne 
que du mode. Si la distribution est symétrique, ces trois caractéristiques de 
tendance centrale sont confondues (cf. figure 1.10). 


Distribution 
symétrique 


Distribution étalée 


Distribution étalée vers la gauche 


vers la droite 


Mo Me x * x Me Mo # 


Figure 1.10 — Positions respectives du mode, de la médiane et de la moyenne 
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b) Les quantiles 
Les quantiles sont des indicateurs de position. 


Le quantile d'ordre & (0 < &< 1), noté x, , est tel qu’une proportion @ 
des individus ait une valeur du caractère X inférieure ou égale à x,, 


Le quantile xs est égal à la médiane. 


On utilise couramment les quantiles d’ordre 1/4, 1/2 et 3/4. Ils sont ainsi 
notés et nommés : 


Q, = premier quartile = X 655 
Q, = deuxième quartile = médiane = x 55 
Q, = troisième quartile = x 675 


Les quartiles se déterminent, comme la médiane, à l’aide de la profondeur 
(variable discrète), ou à l’aide des fréquences cumulées (variable continue). 


Dans le cas d’une variable statistique discrète, le premier quartile Q, et le troi- 
sième quartile Q, sont des éléments de même profondeur égale à (m + 1)/2 où 
m désigne la partie entière de la profondeur de la médiane. On peut aussi 
considérer Q, comme la médiane des m premières valeurs de la série et ©Q; 
comme la médiane des mn dernières valeurs. Ainsi par exemple, pour une série 
de 39 observations, la médiane a une profondeur égale à 20, et les quartiles 
Q, et ©, sont de profondeur 10,5  ; pour une série de 50 observations, la 
médiane a une profondeur de 25,5 et la partie entière de cette profondeur 
étant 25, les quartiles Q, et Q, sont de profondeur 13. 


La pratique de la détermination des quartiles ne respecte pas toujours la 
définition précédente due à Tukey. Aïnsi les calculatrices de poche (TI, 
Casio...) déterminent le 1 ®’ quartile (resp. le 3° quartile) comme la médiane 
des valeurs de profondeur inférieure (resp. supérieure) à la profondeur de la 
médiane. Le résultat diffère de celui calculé avec la définition de Tukey dans 
le cas d’un nombre impair d’observations. Le logiciel SPSS détermine deux 
types de quartiles : « Valeurs charnières » selon la définition de Tukey, et 
« Moyenne pondérée » à l’aide d’une formule d’interpolation linéaire 
[Dodge, 1993]. La détermination des premier et troisième quartiles n’est pas 
standardisée. 


Pour la distribution de la durée hebdomadaire du travail dans les 15 pays 
de l’Union européenne en 2000 (_ cf. tableau 1.4), les premier et troisième 
quartiles sont les valeurs de profondeur 4,5 : 


Q:=3915h et OQ,;=402h 
Dans le cas d’une variable statistique  continue,ona F(Q,) =0,25et 
F(Q;) = 0,75 et on calcule les quartiles par  interpolation linéaire, en raison 


de l’hypothèse d’équirépartition. Pour la distribution de l’ancienneté du chô- 
mage des femmes ( cf. figure 1.5) : 
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Q=1+2 T = 1,9 mois 
= 12+ 12. BTSÈT 16,1 mois 


On peut définir à partir des quartiles Q, et Q, le paramètre de tendance 
centrale (Q, + Q;)/2, égal à la médiane dans le cas d’une distribution symé- 
trique, ainsi que l’intervalle interquartile [Q,, Q;,] qui contient 50 % des obser- 
vations. 

Plus généralement, deux quantiles d’ordres complémentaires x, et xi4 
définissent un intervalle dont le milieu peut être considéré comme un para- 
mètre de tendance centrale. 

De la même façon, on définit les déciles D,, D,...., D, qui sont les quan- 
tiles x;10 (à = 1 à 9), les vingtiles, quantiles x;50 ( à = 1 à 19), les centiles, etc. 
Les classes d’une variable statistique continue sont souvent définies à 
l’aide des déciles. Dans ce cas, on a 10 classes contenant chacune 10  % de 

l'effectif total (cf. tableau 1.5 et figure 1.11). 


Tableau 1.5 — Distribution des salaires annuels nets de tous prélèvements 
pour les salariés à temps complet du secteur privé et semi-public 


Déciles* Ensemble Hommes Femmes 
(en euros courants) 
2000 2006 2000 2006 2000 2006 
D, 10 790 12 718 11 230 13 181 10 190 12 075 
D; 12 220 14219 12 760 14776 11 420 13 431 
D; 13 520 15 545 14 140 16 209 12 500 14 531 
D, 14 910 16 977 15 580 17 729 13 710 15 715 
Médiane 16 500 18 631 17 270 19 466 15 130 17 141 
D, 18 410 20 685 19 330 21 657 16 810 18 924 
D; 20 890 23 430 22 170 24 734 18 850 21 300 
D3 24 780 27 826 26 660 29 787 21 620 24 590 
Do 32 810 36 941 35 020 40 305 26 950 30 962 
D,/D, 3 2,9 3:2 3,1 2,6 2,6 
Salaire moyen 20 400 23 292 21 890 24 912 17 510 20 232 


* En 2006, 10 % des salariés à temps complet du secteur privé et semi-public gagnent un salaire annuel 
net inférieur à 12 718 euros, 20 % inférieur à 14 219 euros. 


Source : INSEE. 
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D, D, D, D, D; D; D; Ds D, 


Figure 1.11 — Histogramme de la distribution des salaires « Ensemble » en 2000 
(voir tableau 1.5) 


C. Les indicateurs de dispersion 


1) L'étendue 


L’étendue est la différence entre la plus grande et la plus petite des valeurs 
observées : 
Étendue = max x; min x; 


IKi<n lSi<n 


Cette mesure de la dispersion ne dépend que des valeurs extrêmes souvent 
exceptionnelles ; elle ne satisfait pas aux conditions 2 et 5 de Yule. II faut 
remarquer aussi que la forme de la distribution entre les valeurs extrêmes 
n’influe pas sur l’étendue. Cependant, cette caractéristique, étant facile à cal- 
culer et ayant une signification concrète facile à comprendre, est fréquem- 
ment utilisée en contrôle industriel de fabrication. 


2) L'étendue interquartile 


De par la définition des quartiles, l'intervalle interquartile [ Q,  Q,] contient 
50 % des observations. Sa longueur, notée ÆE1Q (Etendue InterQuartile), est 
un indicateur de dispersion : 


EIO=0;-0,; 
Le calcul de l’étendue interquartile a l’avantage par rapport à celui de 
l’étendue d’écarter les valeurs extrêmes, souvent sans signification. 


Plus généralement, les longueurs des fourchettes définies par les déciles 
extrêmes, les centiles extrêmes constituent des indicateurs de dispersion 
contenant respectivement 80 % et 98 % des observations. 
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3) L'écart absolu moyen 


On peut définir une caractéristique de dispersion d’une distribution statisti- 
que en calculant les écarts des observations à une tendance centrale  C. La 
tendance centrale de la série ( x; — C) ne peut pas être une mesure de disper- 
sion puisque les écarts positifs sont compensables par les écarts négatifs. 

Par contre, la série |x; — C| définit une variable statistique positive dont les 
valeurs centrales constituent une mesure de dispersion. 

L'écart absolu moyen à la médiane est la moyenne arithmétique des 
valeurs absolues des écarts à la médiane ; on démontre que c’est le plus petit 
écart absolu moyen : 


n k 
Emme = 1S" {x - Mel OU Eye — D fix -Mel 
n 


i=l i=1 
L'écart absolu moyen à la moyenne est la moyenne arithmétique des 
valeurs absolues des écarts à la moyenne arithmétique 


1 n k 
ë. = D Pi % ou €: = DE 


Del i=l 


Dans le cas d’une variable continue classée, on considère, comme pour le 
calcul de la moyenne, que chaque individu a sa valeur égale au milieu de sa 
classe d’affectation. 


4) L'écart-type 
L’écart-type 54 d’une variable statistique X est la mesure de dispersion la plus 
couramment utilisée. 


Algébriquement, il se définit comme la racine carrée de la variance, et la variance 
est la moyenne arithmétique des carrés des écarts à la moyenne arithmétique 


n k 
var(X) = IX G-2? ou var(X) = D fG-3) > sy = 4/vVar(X) 


= i=1 


Il est possible de développer la formule de la variance pour obtenir une 
expression mieux adaptée au calcul (mais cette formule devient inusitée de 
par la diffusion des calculatrices munies des fonctions statistiques !) : 


1. Les calculatrices munies des fonctions statistiques donnent les valeurs de la moyenne et de 
l’écart-type d’une variable statistique dont on a saisi la distribution. Certaines calculatrices 


(dont les calculatrices de marque CASIO®) proposent deux écarts-types : 6, et 6,,. La valeur 


n-l° 
de 6, correspond à celle de l’écart-type s, défini ici et utilisé en statistique descriptive ; quant 


à celle de 6 elle est utilisée en inférence statistique et se déduit de ©, par la formule 


n-1? 


n 
62 


Û . r2 = 
suivante : G£_, = 10 
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var(X) = LY G-27 = LD 3-7 


L=;1 i=1l 
k k 
où var(X) = Dr Ÿ fax? () 


i-1 i=l 


Dans le cas d’une variable statistique continue, on ramène la valeur de cha- 
que individu au milieu de sa classe d’affectation. Là encore, le choix des bornes 
des classes extrêmes non limitées doit être fait avec précaution. 


Mais, alors que pour le calcul de la moyenne, l'erreur liée à ce choix était 
faible dans le cas de distributions approximativement symétriques autour de 
la moyenne, il n’en est pas de même pour le calcul de la variance où les 
erreurs s’ajoutent et ne peuvent pas se compenser. 


L’écart-type est exprimé dans la même unité que les observations, alors 
que la variance s’exprime dans le carré de cette unité. 


On démontre que l’écart-type, donnant plus de poids aux observations 
extrêmes que l’écart absolu moyen à la moyenne, lui est toujours supérieur 
SxZ2ex% 


Propriétés 


1. L’écart-type satisfait aux conditions 1, 2 et 6 de Yule ; l’écart-type 
est plus sensible aux fluctuations d’échantillonnage et aux valeurs extrêé- 
mes que la moyenne, en raison des élévations au carré. 

2. On montre que la variance est le plus petit écart quadratique moyen, 
c’est-à-dire : 


var(X) < IS (x, C})? pour tout C 
LES 
3. Lorsque deux variables X et Y sont en correspondance par le chan- 
gement d’origine x, et le changement d’échelle a, les écart-types se cor- 
respondent par le seul changement d’échelle a pris en valeur absolue : 


er 10h. 


4. Soit une population P de taille n composée de deux sous-populations 
P, de taille n, et P, de taille n,_ Soit X, une variable statistique observée 
sur la population [P, on peut exprimer sa variance var( X) en fonction de 
X,X ZX Var(X,)et var(X;): 


ne 2 
var(X) = : nyvar(X,) +n,var(X,) +n,(x; _ x)2 + n3(X3 — X) 
n 
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Il faut bien remarquer Ve] e la de X sur P est la somme pondé- 
rée des variances de X sur P, et P, augmentée de la somme pondérée des 
carrés des différences entre la moyenne de X sur [P et les moyennes sur 

, êt P,. Ce résultat se généralise à une partition en k sous-populations 
(k > 2). 

5. Les distributions statistiques symétriques telles qu'environ : 

° 2/3 de la distribution se situent à moins d’un écart-type de x ; 

+95 % de la distribution se situent à moins de deux écarts-types de x 

sont dites normales (chapitre 7, $ ID). 

Le friplet (n, X, s,) est un résumé exhaustif des distributions de ce type. 
Dans de nombreux cas, la normalité étant approximative, ( n, X, s-) est alors 
un résumé (quasi-exhaustif) qui présente un intérêt primordial. 


D’autres mesures de la dispersion peuvent être envisagées. On peut cal- 
culer un écart médian, égal à la médiane de la série des valeurs absolues des 
écarts à une valeur centrale choisie. On peut aussi calculer la différence 
moyenne égale à la moyenne arithmétique des valeurs absolues des différen- 
ces entre les observations prises deux à deux. C’est cet indicateur de disper- 
sion qui est utilisé pour le calcul de l’indice de concentration de Gini ($SHI.E) 
et qui, ne mesurant pas la dispersion par rapport à la moyenne, est adapté aux 
distributions non symétriques. 


D. Les caractéristiques de forme 


La plupart des distributions statistiques sont unimodales. En complément de 
l’étude de la tendance centrale et de la dispersion, il est intéressant de repérer 
la forme (déjà mise en évidence par une représentation graphique) par des 
mesures de son asymétrie (en anglais, skewness) et de son  aplatissement 
(kurtosis). 


La symétrie est un concept important pour plusieurs raisons. Tout 
d’abord, la définition de la tendance centrale est sans ambiguité pour une dis- 
tribution symétrique puisque pour une telle distribution, la médiane est égale 
à la moyenne et à (x, +x,_,)/2 pour tout & compris entre 0 et 0,5, et la 
dispersion des observations est symétrique par rapport à la moyenne. D'autre 
part, de nombreuses méthodes statistiques reposent sur une hypothèse de dis- 
tribution(s) normale(s) ou s’en approchant (chapitre 7). Le caractère de symé- 
trie d’une distribution apparaît donc particulièrement important. 


Les mesures de la forme sont indépendantes des unités de mesure de la 
variable étudiée. 
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1) Définition des moments centrés 


Le moment centré d'ordre r d’une distribution est égal à la moyenne arith- 
métique des puissances d’ordre r des écarts (x; X): 


= lŸG-n où = Dit 


i=l i=l 


— Remarque 


Le moment centré Li, est nul, et le moment centré LL, n’est autre que la 
variance et ne peut être nul, comme tous les moments centrés d’ordre 
pair, que si toutes les observations ont la même valeur. 


2) L'asymétrie 


Pour une distribution symétrique, la moyenne arithmétique est égale à la 
médiane et à (x,+x1_,)/2 pour & compris entre 0 et 0,5. D’autre part, les 
moments centrés d’ordre impair sont nuls pour une distribution symétrique, 
négatifs pour une distribution unimodale étalée à gauche, positifs pour une 
distribution unimodale étalée à droite. Ces propriétés sont utilisées pour dia- 
gnostiquer et mesurer l’asymétrie. 


a) Diagnostic et mesure de l’asymétrie à l’aide des quantiles 


Dans un cas d’asymétrie, la comparaison des quantités (x; +X1_a)/2, 
milieux des intervalles [x,, ,x1.4], pour différentes valeurs de © (0 < & < 0,5) 
donne une indication rapide sur le type de l’asymétrie. Certains logiciels don- 
nent la représentation graphique de ces quantités en fonction des amplitudes 
(Xi _4— X,). Pour une distribution symétrique, on obtient une droite parallèle 
à l’axe des abscisses puisque les termes (x,+x,_,)/2 sont tous égaux à la 
médiane (et à la moyenne !). 


Pour la distribution des salariés masculins en 2000 ( cf. tableau 1.5), la 
comparaison des milieux des intervalles des déciles symétriques par rapport 
à la médiane montre qu’il s’agit d’une distribution étalée vers la droite 


D:.#D; D:4D, D, + D; D, + D; 


D:=17270< va 17455 < =18155< =19710< =23 125 


Le quotient suivant définit un coefficient d’asymétrie, appelé coefficient 
de Yule et Kendall : 


(Q3— Q2) —-(Q: — Q:) L Q;+0;-20,; 
(Q3— Q:)+(Q:-0Q;) Q;-0Q,; 
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Ce coefficient, compris entre — 1 et + 1, est nul pour une distribution 
symétrique, positif pour une distribution unimodale étalée vers la droite et 
négatif dans le cas contraire, et il est, de plus invariant par changement d’ori- 
gine et d’échelle. 

On obtient des variantes de ce coefficient en remplaçant les quartiles par 
les déciles. Pour les distributions des salaires présentées dans le tableau 1.5, 
on peut calculer le coefficient d’asymétrie suivant : 


Do +D,-2D; 
Do D; 
qui vaut respectivement 0,49 et 0,41 pour les distributions des salaires mas- 


culins et féminins en 2000 ; ces valeurs indiquent des distributions asymétri- 
ques, étalées vers la droite. 


b) Le coefficient d’asymétrie de Fisher 
Le coefficient d’asymétrie de Fisher , noté y], est ainsi défini : 


rer pour LU, # 0 
Comme tout coefficient d’asymétrie, il est nul pour une distribution symé- 


trique, négatif pour une distribution unimodale étalée vers la gauche, positif 
pour une distribution unimodale étalée vers la droite (figure 1.12). 


LL + 
> 0 v1=0 v1<0 


Figure 1.12 — Signe du coefficient d'asymétrie 


Les coefficients calculés par les logiciels statistiques sont soit celui de 
Fisher, soit des variantes de même l'interprétation. Par exemple, le logiciel 
SPSS donne un coefficient d’asymétrie légèrement modifié : 


n 


ne 23 
eee 35" pour n 


3) L'aplatissement 


Les coefficients d’aplatissement mesurent l’aplatissement d’une distribution 
ou l’importance des « queues » d’une distribution. Le coefficient d’aplatisse- 
ment de Fisher, noté y; , est ainsi défini : 


bre pour LL # 0 
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Ce coefficient est nul pour une distribution normale (chapitre 7), positif 
ou négatif selon que la distribution est plus ou moins aplatie que la distribu- 
tion normale de même moyenne et de même écart-type. 


Les coefficients calculés par les logiciels sont celui de Fisher ou des 
variantes de même interprétation. 


Ces coefficients d’asymétrie et d’aplatissement sont invariants par chan- 
gement d’origine et d'échelle, mais ils sont sensibles aux fluctuations 
d’échantillonnage puisqu'ils font intervenir des moments d’ordre élevé. 


E, Les caractéristiques de dispersion relative 


Ces caractéristiques permettent de comparer les distributions statistiques de 
plusieurs sous-ensembles d’une même population, ou de faire des comparai- 
sons dans le temps ou dans l’espace. 


1) Le coefficient de variation et l'interquartile relatif 


Supposons que nous sachions que l’écart-type de poids d’une certaine popula- 
tion est de 8 kg, l’importance du degré de variabilité que cela suggère dépend 
de la valeur du poids moyen : 10 kg, 50 kg ou plusieurs centaines de kg. 


Pour remédier à cette difficulté d'interprétation, il est naturel d’examiner 
le rapport s,/X appelé coefficient de variation et défini en général pour des 
variables positives. 


C’est un nombre sans dimension, invariant si on effectue un changement 
d'unité de mesure. 


Plus le coefficient de variation est élevé, plus la dispersion autour de la 
moyenne est élevée. 


Ce coefficient permet de comparer les dispersions de distributions qui ne 
sont pas exprimées dans la même unité (comme des distributions de salaires 
de pays différents) ou de distributions dont les moyennes sont différentes 
(comme des distributions de salaires pour différentes qualifications). 


On peut construire d’autres coefficients de ce type en utilisant les statis- 
tiques d’ordre comme les quartiles et les déciles ; citons l” interquartile 


Q;-0Q: —D, 


! : 3 à = 
relatif: == et l’interdécile relatif : == 
2 5 


Pour les distributions des salaires « Hommes » et « Femmes » en 2001 (cf. 
tableau 1.5), les interdéciles relatifs valent respectivement 1,45 et 1,12. 
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2) Les caractéristiques de concentration 


La notion de concentration a été introduite à propos des distributions de 
salaires et de revenus. Cette notion est apparentée à celle de dispersion 
puisqu'elle concerne l’intensité du groupement des données. 


Elle ne s’applique qu’à des variables continues à valeurs positives, et pour 
des ensembles statistiques dont chaque élément est affecté d’un caractère sus- 
ceptible d’addition : 


un ensemble de ménages classés selon le revenu, l’épargne, le 
patrimoine. ; 


° un ensemble d’entreprises classées selon le chiffre d’affaire, le nombre 
de salariés, les montants des factures... ; 


° un ensemble d’exploitations agricoles classées selon la surface agricole 

utilisée. 

Il est clair que la notion de concentration ne peut pas s’appliquer, par 
exemple, à des ensembles d’individus classés selon l’âge, la taille ou le poids, 
puisque la somme des âges, des tailles ou des poids d’une population est sans 
signification. 

La concentration peut se caractériser, soit par un procédé graphique, soit 
par le calcul. 


a) Construction de la courbe de concentration 


Considérons la distribution des exploitations agricoles par classes de gran- 
deurs des régions Provence-Alpes-Côte d’ Azur (PACA) et Midi-Pyrénées en 
2005 (cf. tableau 1.6). L’intervalle de variation de la SAU (superficie agricole 
utilisée) est partagé en k classes (ici, & = 9) dont les bornes supérieures sont 
notées dans l’ordre : x1 ,..., X;,..., xp 


On calcule pour chaque classe ( i = 1 à k): 
+ la proportion cumulée p ; des exploitations de SAU inférieure à x; 


* la proportion cumulée q; de la SAU totale des exploitations de SAU infé- 

rieure à x; 

Sur un diagramme cartésien, on représente les k points de coordonnées 
P;, q,). Ces points s’inscrivent dans un carré OABC dont la longueur des 
côtés est égale à 1 (ou 100 si les proportions sont exprimées en pourcentage). 


La courbe qui joint les points successifs est la courbe de concentration 
ou courbe de Lorenz (cf. figure 1.13). La courbe, toujours en-dessous de la 
bissectrice, permet de lire que les  ©& % des exploitations les moins bien 
loties cultivent B % de la SAU totale. Si toutes les exploitations ont une part 
égale de SAU, la courbe se confond avec la bissectrice OB. La courbe s’en 
éloigne lorsque l’inégalité s’accroît. 
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Tableau 1.6 — Distribution des exploitations agricoles par classes de grandeurs 
en régions PACA et Midi-Pyrénées 


Midi-Pyrénées PACA nn PACA 
Proportion Proportion 

l SAU Ï SAU . à # L 
Moins de 5 ha 15,5 0,8 44,9 2,6 15,5 0,8! 449! 2,6 
5 à moins de 10 ha 9,0 1,4 12,5 3,1 24,6| 2,2| 574! 5,7 
10 à moins de 20 ha 13,2 4,2 14,8 7,6 37,7| 6,4] 72,2| 13,2 
20 à moins de 35 ha 15,7 9,2 9,3 8,6 53,41 15,7] 81,5! 21,9 
35 à moins de 50 ha 12,2 11,1 5;1 7,4 65,6! 26,8| 86,6| 29,3 
50 à moins de 100 ha 23,1 35;1 7,2 17,6 88,7| 61,9] 93,8| 46,9 
100 à moins de 200 ha 9,6 27,5 3,7 18,1 98,2| 89,41 97,5] 65,0 
200 à moins de 300 ha 1,3 6,6 1,4 11,5 99,5| 96,0! 98,9| 76,5 
300 ha ou plus 0,5 4,0 1,1 23,5 100 |100 1100 |100 

100 100 100 100 


Source : agreste.agriculture.gouv.fr 


Ceci suggère d’utiliser l’aire, dite aire de concentration , comprise entre 
la courbe et la bissectrice OB comme indicateur d’inégalité. 


q 100 


Ë 20 


Figure 1.13 — Courbe de Lorenz 


(0) 20 40 60 80 100 


Figure 1.14 — Courbes de concentration des SAU 
dans les régions PACA et Midi-Pyrénées 
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On peut comparer la concentration de deux ou plusieurs populations selon 
un même caractère en représentant sur un même graphique leurs courbes de 
Lorenz. Les terres agricoles sont plus concentrées dans la région PACA que 
dans la région Midi-Pyrénées puisque la courbe de Lorenz de la SAU de la 
région Midi-Pyrénées est incluse dans celle de la région PACA (cf. figure 1.14). 


On peut aussi comparer la concentration de deux caractères sur une même 
population : sur la figure 1.15, on constate que la concentration du patrimoine 
financier des ménages est plus forte que celle des revenus. 

Dans les cas où les courbes se coupent, on ne peut pas comparer les degrés 
d’inégalité. 
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Lecture : plus la courbe s'éloigne de la diagonale, plus la distribution de la variable considérée est concentrée. La moitié des 
ménages les moins riches possède 27 % de la masse des revenus disponibles tandis que la moitié des ménages les moins 
bien dotés possède environ 4 % de la masse totale de patrimoine financier. Les 10 % les mieux dotés en patrimoine 
financier en possèdent environ 63 %. 


Champ : ménages dont la personne de référence n'est pas étudiante et dont le revenu déclaré est positif ou nul. 
Sources : enquête Revenus fiscaux 2003, Insee-DGl pour le revenu disponible et enquête Patrimoine 2004, Insee, montants 
de patrimoine financier recalés sur les données de la Comptabilité nationale. 


Source : INSEE, Économie et Statistique, n° 414, 2008. 


Figure 1.15 — Courbes de concentration 


b) Détermination de l’ indice de concentration ou indice de Gini 


L'indice /; de Gini est égal au double de l’aire de concentration ( cf. figure 
1.13). Cet indice, compris entre 0 et 1, a une valeur d’autant plus élevée que 
la répartition est plus inégalitaire, et peut être évalué selon la formule !: 


n n 
y > pu x) 
[. = i=tisiti 
à n(n—-1)-x 
les x; (i= 1,... , n) désignant ici les valeurs prises (supposées toutes distinctes) 
par la variable sur chacun des n individus de la population étudiée. 


1. Le statisticien italien Corrado Gini a proposé cette mesure de la concentration en 1912 et a 
montré deux années plus tard que son indice était égal au double de l’aire comprise entre la 
droite d’équirépartition et la courbe proposée par Max Otto Lorenz en 1905. 
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Cet indice s’apparente donc bien à la notion de dispersion relative des 
éléments d’une série. C’est un nombre sans dimension. Cette caractéristique 
de dispersion ne fait pas appel au calcul d’écarts à la moyenne. Elle est ainsi 
particulièrement bien adaptée à l’étude de distributions très dissymétriques 
pour lesquelles la notion d'écart à la moyenne est sans grande signification. 


IV. La boîte de distribution 


La boîte de distribution (box-plot en anglais, ou encore « boîfte-à-pattes », 
« boîte à moustaches », « boîte de dispersion » en français) est un outil pri- 
vilégié de l’ analyse exploratoire des données . Elle fournit en un seul coup 
d’oeil des informations sur sa tendance centrale, sa dispersion, son asymétrie, 
l'importance des valeurs extrêmes. Elle est aussi particulièrement intéres- 
sante pour la comparaison de distributions sur plusieurs de ces critères. 


A. Résumé d'une distribution par des quantiles 


Les trois quartiles Q,, O, et O, et les deux valeurs extrêmes fournissent pour 
une distribution des informations sur sa tendance centrale par les quantités 


Q, , 1(o, +0Q;,)et 1 min x, + max x; |, sur sa dispersion par l’étendue et 
2 1<i<n 1<i<n 


l’étendue interquartile, et sur sa forme par la comparaison des trois indica- 
teurs de tendance centrale. 


En analyse exploratoire des données, ces cinq valeurs sont présentés avec 
leur profondeur dans un tableau. Pour la distribution de la durée hebdoma- 
daire du travail en 2000 ( cf. tableau 1.4) : 


n=15 Durée hebdomadaire 
8 Me=399h 
4,5 Q,=39,15 Q; = 40,2 
1 minx;=38,5 max x; = 43,6 
1<i<n 1<i<n 


On peut compléter ce tableau en indiquant l’étendue interquartile, le 
milieu de l’intervalle interquartile, l'étendue et le milieu de l’intervalle déter- 
miné par les deux valeurs extrêmes. On obtient ainsi un résumé des informa- 
tions sur la dispersion et l’asymétrie : 
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n=15 Durée Dispersion Position 


hebdomadaire 
8 399 h 
4,5 39,15 40,2 EIQ = 1,05 >(@ +03) = 39,615 
1 38,5 43,6 Étendue = 5,1 1 ( min x; + max x) = 41,05 
2 \ I1Si<n 1<i<n 


B. Représentation d'une boîte de distribution 


Dans une boîte de distribution , la boîte représente l’intervalle interquartile, 
et à l’intérieur, la médiane la sépare en deux parties. Les lignes qui partent 
du bord de la boîte s’étendent jusqu’aux valeurs les plus extrêmes qui ne sont 
pas considérées comme éloignées. Le logiciel SPSS note « valeur éloignée » 
(o), les points situés à plus de 1,5 fois l’étendue interquartile par rapport aux 
bords de la boîte, et « valeur extrême » (*), les points situés à plus de 3 fois 
l'étendue interquartile (cf. figure 1.17). 


Ainsi, la taille de la boîte représente l’étendue interquartile, la position de 
la médiane est un bon indicateur de la symétrie de la distribution, la taille des 
lignes de part et d’autre de la boîte traduit la dispersion, et les valeurs éloi- 
gnées ou extrêmes sont immédiatement repérées. 


On représente une boîte de distribution de la façon suivante (cf. figure 1.16) : 


a) on trace un rectangle de largeur fixée à priori et de longueur 
EIQ = (Q; — Q,), et on y situe la médiane par un segment positionné à la 
valeur Q,, par rapport à Q, et Q, ; on a alors la boîte, 


b) on calcule (Q; + 1,5 : E1QO) et (Q, — 1,5 - EIO) et on cherche : 
* la dernière observation x, en deçà de la limite ( Q; + 1,5 - EZQ) soit 
X, = Mmax{x; | x; < O; + 1,5 - EIQO} 
* la première observation x, au delà de la limite ( Q1 — 1,5 + EJQ) soit 
x =min{x;|x;,2Q,-1,5:EIQ} 
c) on trace deux lignes allant des milieux des largeurs du rectangle aux 
valeurs x, et x, 


Ainsi, pour la distribution représentée à la figure 1.16, la valeur 
« éloignée » associée au Royaume-Uni et mise en évidence sur le diagramme 
Branche et feuille de la figure 1.6, est à l’extérieur de la boîte de distribution. 
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38 39 40 ai 42 43 


Étendue 


: 
T 
Minimum | X Q, Me Q, Xh 


b Maximum 
Q,-1,5- ElQ Q; + 1,5 - EIQ 


Figure 1.16 — Construction de la boîte de distribution de la durée du travail en 2000 
(tableau 1.4) 


Ce type de diagramme permet aussi de comparer facilement plusieurs dis- 
tributions en terme de médiane, quartiles et valeurs éloignées ou extrêmes. 


On peut représenter en parallèle les boîtes de distribution de la durée heb- 
domadaire du travail des salariés à temps complet de l’Union européenne en 
1990,1995 et 2000, et comparer les trois distributions ( cf. figure 1.17). 
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N = 15 15 15 
1990 1995 2000 


Figure 1.17 — Représentation SPSS des boîtes de distribution du tableau 1.3 
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La médiane n’évolue pas de façon monotone, la dispersion diminue, le 
Royaume-Uni passe de « valeur éloignée » en 1990 à « valeur extrême » en 
1995 et 2000. 


Pour les distributions présentées par leurs déciles (cf. tableau 1.5), on ne 
connaît pas les valeurs individuelles. Dans ce cas, on peut convenir de 
considérer valeurs éloignées les valeurs inférieures au premier décile ou 
supérieures au neuvième décile. 

La représentation des boîtes de distribution des distributions de salaires en 
2000 permet de comparer les salaires selon le sexe (cf. figure 1.18). La repré- 
sentation par des histogrammes ( cf. figure 1.11) ne permettrait pas de com- 
parer aussi aisément les distributions, les histogrammes ne pouvant pas être 
superposés si on veut conserver la lisibilité, mais seulement juxtaposés. 


À 
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Figure 1.18 — Représentation des boîtes de distribution des salaires en 2000 


C. Interprétation d'une boîte de distribution 


Une boîte de distribution rend compte de la tendance centrale, de la disper- 
sion, des valeurs éloignées ou extrêmes et de la forme de la distribution ( cf. 
figure 1.19), même si d’autre modes de représentation (histogramme, branche 
et feuille) peuvent apporter un complément d’information sur la forme. 
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Figure 1.19 — Quelques types de boîtes de distribution : 
1. Distribution symétrique 
2. Distribution peu dispersée 
3. Distribution étalée vers les valeurs élevées 
4. Distribution étalée vers les valeurs faibles 


En statistique descriptive, on a vu l’importance du  friplet (n ,,X Sy). 
Pour la distribution de la durée hebdomadaire du travail du tableau 1.4, ce 
triplet prend les valeurs (15 ; 39,93 ; 1,2) pour l’année 2000. La boîte de 
distribution (cf. figures 1.15 et 1.16) est un complément qui se révèle inté- 
ressant puisqu'elle permet de détecter l’asymétrie, les valeurs extrêmes, et 
de repérer la médiane et l’intervalle interquartile qui contient la moitié des 
observations. 


Dans le cas d’une asymétrie, l’écart-type qui mesure la dispersion  symé- 
triquement par rapport à la moyenne n’est pas la mesure de dispersion la 
mieux adaptée, et peut être complété par l’étendue interquartile. D’autre part, 
si la boîte de distribution indique des valeurs éloignées ou extrêmes, on sait 
que la moyenne et l’écart-type sont particulièrement influencés par ces 
valeurs. 


V,. Bilan 


Avant toute étude formelle, il est nécessaire de procéder à une évaluation 
descriptive des données. Cette approche descriptive présente deux difficultés, 
l’une liée aux calculs, l’autre à la diversité des indicateurs. Si les calculatrices 
de poche ont permis depuis longtemps déjà de rendre aisés les calculs de 
moyenne et écart-type, il a fallu attendre la généralisation des moyens de calcul 
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automatique (en particulier, des logiciels statistiques sur m icro-ordinateurs) 
pour que tous les indicateurs basés sur la notion de profondeur, et en parti- 
culier la médiane, soient facilement accessibles. C’est aussi l’environnement 
récent des micro-ordinateurs qui a permis de développer les modes de représen- 
tation graphique par lesquels on peut appréhender des indicateurs très divers. 
L'approche descriptive des données trouve dans la représentation graphique un 
enrichissement et une aide à l’interprétation. Simplicité et inter activité de cette 
démarche en font une première étape maintenant indispensable à toute étude 
statistique. 
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Testez-Vous (es réponses sont données page 283) 


Il y a au moins une réponse exacte par question. 


1. Pour une série d’observations d’une variable statistique : 
a) on peut calculer quatre quartiles 

b) l'intervalle interquartile contient 50 % des observations 

c) le cinquième décile est égal à la médiane 


d) 50 % des observations sont supérieures au premier quartile 


2. Pour une variable statistique de distribution symétrique : 

a) la moyenne est égale à la médiane 

b) 50 % des observations sont supérieures à la moyenne 

c) la boîte de distribution contient toutes les observations 

d) (Q3 - Q1) = 2(Me — Q:) 

3. Pour comparer des distributions de variables statistiques exprimées dans des 


unités différentes (par exemple des distributions de salaires exprimés dans des 
monnaies différentes), on peut utiliser les caractéristiques suivantes : 


a) la médiane 

b) l’étendue interquartile 

c) le coefficient de variation 
d) le rapport D,/D; 


4. Pour une série d’observations d’une variable statistique : 

a) la somme des écarts à la moyenne est nulle 

b) l’écart absolu moyen à la moyenne est un indicateur de dispersion 

c) la médiane de la série des écarts absolus à la moyenne est une mesure de l’asymétrie 


d) les trois quartiles sont des indicateurs de tendance centrale 


5. Une étude des notes obtenues par deux classes d’une école à un test commun 
a fourni les résultats suivants : 


Classe Classe 1 Classe 2 
Effectif 20 30 
Moyenne 12 10 
Écart-type 4 6 
Médiane 12 12 


a) la note moyenne des deux classes réunies est égale à 11 
b) l’écart-type des notes des deux classes réunies est égal à 5 
c) la médiane des notes des deux classes réunies est égale à 12 


d) l’écart absolu moyen des notes à la médiane est inférieur ou égal à 4 pour la classe 1 
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6. Si on veut minimiser l’influence des valeurs extrêmes : 

a) on préfère la médiane à la moyenne 

b) on préfère l’écart-type à l’écart absolu moyen à la moyenne 

c) on préfère l’étendue à l’étendue interquartile 

d) on préfère l’étendue interdécile ( D, — D,) à l’étendue 

7. Soit une grandeur dont le taux de croissance au cours de 3 années successives 


a été de 0,5 % pour les 2 premières années et de 2 % pour la dernière année. 
Le taux annuel moyen de croissance pendant ces 3 années est égal à 


1/3 


a) ((0.005)° (0, 02) 


b) 10 0,005 + 0,02) 


1/3 
c) («00572 102) | 


d) une moyenne harmonique 


8. Pour la distribution d’une variable statistique continue (ou supposée 
continue) : 


a) l’histogramme est la représentation graphique des fréquences cumulées 

b) 15 % des observations sont comprises entre le troisième quartile et le neuvième 
décile 

c) la médiane peut se déterminer à l’aide de la courbe cumulative 


d) l’étendue interdécile (Do — D;) contient 90 % des observations 


9. Si les notes (comprises entre 4 et 16) obtenues à une épreuve de statistique 
dans une classe de 30 élèves sont toutes augmentées de 2 points 


a) la moyenne sera augmentée de 2 points 
b) l’écart-type sera augmenté de 2 points 
d) la médiane sera augmentée de 2 points 


d) l’étendue sera augmentée de 2 points 
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Exercices (corrigés page 289) 


Exercice 1.1 


Le tableau suivant donne la répartition des familles selon le nombre d’enfants et leur 
âge de 1968 à 1999: 


Enfants de 0 à 18 ans (milliers) 


1975 1982 1990 1999 

Ensemble 13 176 14119 15 391 16 097 
sans enfant 5 836 6 508 7 900 8 679 
avec enfants 7 340 7 610 7 491 7 418 
1 enfant 3 110 3 303 3 281 3317 
2 enfants 2 374 2734 2756 2772 
3 enfants 1 088 1 081 1 063 1 008 
4 enfants 427 310 259 230 
5 enfants 342 183 132 91 
ou plus 

Nombre total 14 826 14 294 13 748 13 308 
d’enfants 


Sources : Recensements de la population, INSEE 


1. Définir les populations étudiées, l’unité statistique, le caractère étudié et sa nature. 


2. Examinez l’évolution du nombre total de familles sans enfant, du nombre de 
familles avec enfants, avec un enfant, avec deux enfants. 


3. On considère dans cette dernière question les familles avec enfant(s). 


3.1. Après avoir calculé les fréquences, tracez les diagrammes en bâtons de ces 
distributions, et indiquez le mode. 


3.2. Pour chacune des cinq années, calculez le nombre moyen d’enfants par 
famille et l’écart-type (on considérera le nombre moyen d’enfants des familles 
ayant cinq enfants ou plus égal à 6). Commentez les résultats. 


Exercice 1.2 


Le tableau suivant donne la distribution du niveau de l’indice de la qualité de l’air 
ATMO en agglomération parisienne de 2000 à 2006 (en nombre de jours par an). 


1. Définir les populations étudiées, l’unité statistique, le caractère étudié et sa nature. 
2. Tracez le diagramme en bâtons de la distribution en 2006, et indiquez le mode. 


3. Calculez les niveaux annuels moyens de 2000 à 2006. 
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Niveau | Qualité 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 | Total 
1 Très bon 0 0 0 0 0 0 0 0 
2 Très bon 8 15 9 15 23 23 25 118 
3 Bon 206 | 190 | 183 | 138 | 186 | 188 | 177 | 1 268 
4 Bon 99 97 | 111 | 109 96 99 | 106 717 
5 Moyen 36 33 45 47 39 34 26 260 
6 Médiocre 13 13 8 30 19 11 16 110 
7 Médiocre 2 14 7 16 2 6 11 58 
8 Mauvais 2 3 2 10 1 4 4 26 
9 Mauvais 0 0 0 0 0 0 0 0 
10 Très mauvais 0 0 0 0 0 0 0 0 

Total 366 | 365 | 365 | 365 | 366 | 365 | 365 2357 


Exercice 1.3 


Source : AIRPARIF. 


On a relevé pendant 50 quinzaines successives les niveaux de ventes, exprimés en 
milliers d'unités de produit, de deux présentations notées G (Gel) et P (Poudre) d’un 
même produit. Les résultats sont les suivants : 


Présentation G 


Présentation P 


Niveau de | <5 | [5-10[ | [10-12[ | [12-20] Niveau de | <10 | [10-12[ | [12-16[ | [16-20] 
vente vente 

Nombre de 5 20 15 10 Nombre de 10 25 10 5 

quinzaines quinzaines 


1. Calculez les moyennes, écarts-types et médianes des niveaux de ventes pour cha- 
cune des deux présentations. 


Quelle est la condition nécessaire sur la moyenne et la médiane d’une distribution 
pour que celle-ci soit symétrique ? 


2. Sur l’ensemble des points de vente pour toute la période de l’étude, on disposait 
de 30 % du produit en gel, et de 70 % du produit en poudre. 


Quel a été le niveau de ventes moyen pour l’ensemble des deux présentations du 
produit ? 


3. Les niveaux de ventes étant maintenant exprimés en centaines d’unités de produit, 
donnez les nouvelles valeurs des moyennes, écarts-types et médianes calculées à 
la 1'e question. 
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Exercice 1.4 


Afin d'étudier les disparités de salaires entre hommes et femmes, une enquête a été 
réalisée auprès du personnel ouvrier d’un secteur industriel. Les résultats concernant 
les salaires annuels nets en euros sont résumés dans les deux tableaux suivants 


Tableau 1. Hommes 


Effectif 180 Tableau 2. Femmes 
Salaire moyen 15 400 Salaire annuel Nombre d’ouvrières 
) (en milliers d’€) 
Écart-type 3 620 
[10 ; 121 82 
1er décile 10 950 [12 ; 14[ 34 
[14 ; 16[ 12 
1e quartile 12 750 [16 ; 20] na 
Médiane 14 800 Total N 
3e quartile 17 660 
9e décile 20 220 


1. Définir la population étudiée, l’unité statistique, le caractère étudié et sa nature. 


2. Proposez pour la distribution du salaire des hommes en précisant les valeurs cor- 
respondantes : 


e trois indicateurs de tendance centrale ; 
e deux indicateurs de dispersion ; 
e deux indicateurs de dispersion relative. 


3. Sachant que le salaire annuel moyen des femmes enquêtées est égal à 12000 Æ, 
déterminez l'effectif n, de la dernière classe de la distribution du salaire des fem- 
mes, ainsi que l’effectif total N. 


4. Déterminez l’écart-type et le coefficient de variation de la distribution des 
femmes. 


5. Déterminez le salaire annuel moyen de l’ensemble des ouvriers hommes et 
femmes de l’enquête. 


Exercice 1.5 


Dans un atelier, le coût horaire de la main d’oeuvre est de 8 € (base 35 h par 
semaine). Une heure supplémentaire revient à 10 €, et le service de paie indique que 
le coût total des heures supplémentaires représente 30 % du coût total de la main 
d’oeuvre. 


Calculez le coût horaire moyen et indiquez le type de moyenne utilisée. 


Exercice 1.6 


Une même somme S a été confiée à deux banques B; et B;, pour une durée de 10 ans. 
Les rendements successifs des placements effectués par les deux banques ont été les 
suivants : 
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e Banque B, : 12 % pendant 2 ans, puis 8 % pendant 4 ans, puis 6 % pendant 4 ans ; 
e Banque B, : 10 % pendant 3 ans, puis 8 % pendant 3 ans, puis 7 % pendant 4 ans. 

Les intérêts sont toujours capitalisés en fin d’année. 

1. Calculez le taux moyen de croissance du placement dans chaque banque. 

2. À quel taux la moins performante des deux banques aurait-elle dû placer l’argent 
pendant la troisième période pour égaler l’autre ? 

Exercice 1.7 


Le tableau ci-après donne des caractéristiques des 30 premiers groupes français de 
l’industrie et des services selon leur chiffre d’affaires en 2001 (Source : Tableaux de 
l'Économie Française 2003-2004, INSEE) : 


CAHT CAHT 
Société (millions Effectif Société (millions | Effectif 
d'€) d’'€) 
TotalFinaElf 105 318 122 025 Aventis 22 941 91 729 
Carrefour 69 486 382 821 Groupe Casino 21 984 106 736 
(Rallye) 

Vivendi Universal 57 360 321 000 Bouygues 20 473 126 560 

PSA Peugeot 51 663 192 500 Airbus (EADS) 20 427 2 000 
Citroën 

France Telecom 43 026 206 184 SNCF 20129 | 220 747 

Suez 42 359 188 050 Vonci 17 172 129 499 

EDF 40 716 161 738 La poste 17 028 | 313 854 

Les Mousquetaires 37 200 112 000 Publicis Groupe 16 667 20 592 

Renault 36 351 140 417 Michelin 15 775 127 467 

Saint-Gobain 30 390 173 329 Havas 14 950 20 373 

Pinault-Printemps- 27 799 115 935 Usinor (Arcelor) 14 523 59 516 

La Redoute 

Groupe Auchan 26 200 136 000 Groupe Danone 14 470 100 560 

Alcatel Alsthom 25:353 99 314 Gaz de France 14 357 36 451 

Galec (Leclerc) 25 000 75 000 | L'Oréal (Gespartal) 13 740 49 150 

Alstom 23 453 118 995 Lafarge 13 698 82 892 


1. Définir la population étudiée, l’unité statistique et les caractères étudiés. 
2. Calculez la moyenne et l’écart-type du chiffre d’affaires et de l’effectif. 
3. Étude du chiffre d’affaires des 30 premiers groupes français. 

3.1. Déterminez les trois quartiles. 

3.2. Représentez le diagramme branche et feuille de cette distribution. 


3.3. Représentez la boîte de distribution. 
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4. Quel est l'intérêt de chacune de ces deux représentations graphiques comparative- 
ment à un histogramme ? 


5. Reprendre la question 3 pour l’étude de l’effectif. 


Exercice 1.8 


Le tableau suivant donne le revenu annuel moyen des ménages, en euros, pour les 
dix intervalles définis par les déciles, et la part de chaque intervalle dans le revenu 
total. 


Valeur des déciles aa son moyen 7 re ee 
(euros) dans l’intervalle ne onale 

D, =7 304 <D; 3 845 2 
D,= 11091 [D, ; D, 9318 3 
D; = 14 099 [D, ; Di 12 601 5 
D,= 17 219 (D; ; DII 15 640 6 
Ds = 20 631 [D ; Di 18 863 7 
D,= 24 653 [D ; Dé[ 22 579 9 
D=29 361 [D ; D;l 26 904 11 
D3= 35 757 [D; ; Dsl 32 324 13 
D, = 46 642 [Dg ; Dol 40 548 16 

= Do 69 930 28 


Source : INSEE, Revenus fiscaux 1999, hors revenus du patrimoine. 


1. Définir la population, l’unité statistique, le caractère étudié et sa nature. 
2. Calculez le revenu annuel moyen des ménages. 


3. Est-il légitime de faire l’hypothèse d’équirépartition dans les classes définies par 
les déciles ? 


4. Proposez trois indicateurs de tendance centrale, un indicateur de dispersion et un 
indicateur de dispersion relative. Donnez les valeurs de ces indicateurs. 


5. Cette distribution de revenus est-elle symétrique ? (justifiez votre réponse) 
6. Proposez un indicateur de disparité des revenus, et donnez sa valeur. Interprétez. 


7. Quelle est la part de l’ensemble des revenus perçus par les 4 dixièmes des ménages 
aux revenus les plus faibles ? 


8. Soit F,= 10 %, F,=20 %, .… , F,9= 100 %, et R; la part de l’ensemble des reve- 
nus perçus par l’ensemble des F; ménages aux revenus les plus faibles. 
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8.1. Tracez la courbe joignant, dans l’ordre, les points ( F;, R;). Comment s’appelle 
cette courbe ? 


8.2. Rappelez l'interprétation graphique de l’indice de concentration de Gini ? 
8.3. Quelles sont les valeurs minimum et maximum de cet indice ? 
8.4. À quelles situations correspondent-elles ? 

D'après examen de juin 2004, GEA 1" année Paris-Dauphine. 


Exercice 1.9 


Le tableau suivant donne le nombre (en milliers) et la superficie agricole utilisée 
(SAU, en milliers d’ha) des exploitations agricoles en France métropolitaine par clas- 
ses de grandeur pour les années 1979, 1988, 2000 et 2005. 


1979 1988 2000 2005 


Nombre | SAU |Nombre| SAU |Nombre| SAU |Nombre| SAU 


Moins de 5 ha 357 677 278 519 193 362 132 262 

5 à moins de 20 ha 410 |4778| 279 |3238 132 1 464 104 1163 
20 à moins de 50 ha 347 |10962| 288 9 348 138 | 4666 109 |3714 
50 à moins de 100 ha 114 | 7 683 128 8 709 122 8 662 113 8 083 


100 à moins de 29 3 798 37 4 864 64 8 655 70 9 486 
200 ha 6 1 598 7 1918 15 4 047 17 4762 
200 ha ou plus 

Ensemble 1263 129496] 1017 |28596| 664 127856| 545 |27 470 


Source : INSEE. 


1. Définir la population, l’unité statistique, le caractère étudié et sa nature. 


Calculez, en pourcentage, les taux annuels moyens de variation du nombre des 
exploitations agricoles de 1979 à 1988, de 1988 à 2000, de 2000 à 2005. 


Exprimez le taux annuel moyen de variation de 1979 à 2005 en fonction de ces 
3 taux, de quel type de moyenne s’agit-il ? 


Calculez sa valeur. 


3. Pour les années 1979, 1988, 2000 et 2005, calculez la  SAU moyenne et la SAU 
moyenne des exploitations de 50 ha ou plus. 


4. Pour l’année 2005, représentez l’histogramme de la distribution des exploitations 
agricoles, ainsi que la courbe de concentration de la SAU. 
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2 g | ndices statistiques 


besoin de décrire les variations de grandeurs simples telles que 

le prix du baril de pétrole, la production de blé, le taux de 
fécondité. Ces comparaisons dans le temps (ou dans l'espace) se font 
généralement en effectuant le rapport des valeurs de la grandeur consi- 
dérée à deux dates différentes (ou en deux lieux distincts)  ; on parle 
d'indice statistique élémentaire. 
Mais, il est important d'être en mesure de suivre les évolutions de gran- 
deurs complexes telles que le niveau général des prix, la production 
industrielle, les exportations. Celles-ci peuvent être résumées par une 
caractérisque de tendance centrale d'indices élémentaires, ce qui amène 
à la construction d'indices synthétiques. 
Toute caractéristique de tendance centrale, notamment les différents types 
de moyennes, présentant à la fois des avantages et des inconvénients, il 
n'est pas possible de proposer une méthode unique de construction des 
indices synthétiques. Il existe différentes formules. On va exposer les plus 
utilisées. 
De par l'importance que revêtent ces indicateurs d'évolution dans les dis- 
cussions économiques et politiques, il est nécessaire de bien comprendre 
leur élaboration, d'analyser leurs modes de construction et d'étudier 
leurs propriétés. 


p our l'étude des problèmes économiques et sociaux, on a souvent 


Indices élémentaires 


A. Définition 


On appelle indice élémentaire de la grandeur simple x à la date (ou période) 


t, dite date courante , par rapport à la date O, dite date de référence , le 
rapport : 
x 
Lyo(x) = < 
X0 
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On a l’habitude, pour éviter de traiter des valeurs d’indice avec trop de 
chiffres après la virgule de multiplier le résultat par 100 et de laisser un chif- 
fre après la virgule. Une variation négative est repérée par une valeur infé- 
rieure à 100. 


D Exemple 
La population de la France métropolitaine est passée de 53 731 milliers 
d'habitants au 1 ‘janvier 1980 à 56 577 milliers d’habitants au 
1‘ janvier 1990 et à 58 749 milliers d'habitants au 1‘ janvier 2000 
(source : Tableaux de l'Économie française 2003-2004, INSEE) : 


56 577 


I P) = 100: =——— = 105,3 
1990/1980 (P ) 53 731 
58 749 

2000/1980(P) 00 53731 09, 3 


— La population française a augmenté de 5,3 % de 1980 à 1990 et de 
9,3 % de 1980 à 2000. 


B. Propriétés 


1) Circularité (ou transitivité ou transférabilité) 


Lex) = 1,5 (x) * 1; ,0(x) 
Cette formule permet de changer de base en passant de la date de réfé- 
rence 0 à la date de référence fr’: 
I, yo(X 
Z,,6 (x) — 100) 
le /0(X) 


L'utilisateur a en effet souvent besoin de mesurer l’évolution d’une gran- 
deur entre deux dates différentes de la date de référence. 


De cette propriété, résulte la propriété d’enchaînement : 


Lx) = L,75-1(x) + + Li,0(x) 


2) Réversibilité 


1 
Z;/0(x) 


Cette propriété est intéressante dans le cas de comparaison géographique, 
car le choix du lieu de référence est arbitraire. 


Lo2(x) = 
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3) Multiplication 


Si une grandeur simple z est le produit de deux grandeurs x et y, l’indice 
élémentaire de la grandeur produit est égal au produit des indices des gran- 
deurs facteurs : 


quel que soit f: Z,=X 7), LYC) = I Y®) - 1 00) 


Cas particulier fondamental : 
Valeur = Prix : Quantité ou encore:  Dépense = Prix - Volume 
Cette égalité entraîne : 


Indice élémentaire de valeur = 
Indice élémentaire de prix - Indice élémentaire de quantité 


Ces propriétés immédiates d’un indice élémentaire ne sont généralement 
pas satisfaites par un indice synthétique. 


IL. Indices synthétiques 


Les indices élémentaires retracent l’évolution d’une seule grandeur parfaite- 
ment définie et homogène. 


Mais, le plus souvent, l’économiste ou le dirigeant d’entreprise, si ce n’est 
le citoyen désire suivre les variations de grandeurs complexes telles que les 
prix, la production industrielle. 


Ces grandeurs complexes sont composées d’un nombre plus ou moins 
important de grandeurs simples dont l’évolution est décrite par un indice élé- 
mentaire. 


On appelle indice synthétique, un indice faisant intervenir dans son calcul 
plusieurs grandeurs intéressant un même phénomène économique. Ce type 
d'indice résulte d’un calcul de moyenne. 


Il est impossible de proposer une méthode unique et incontestable permet- 
tant de décrire l’évolution d’une grandeur complexe. 


Les indices synthétiques ont l’inconvénient de ne pas présenter générale- 
ment les propriétés de circularité et réversibilité. Or, ces propriétés seraient 
très utiles au calcul économique ; les changements de base et les raccorde- 
ments d’indices ne peuvent être effectués de façon rigoureuse que sur des 
indices possédant la propriété de circularité. 
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A. Indices synthétiques de Laspeyres et Paasche : 
premières formules 


Soient deux dates 0 et f, la situation à chaque date est caractérisée par les quantités 

disponibles de n biens physiques hétérogènes gÿ (i= 1,2... ,n) respectivement 

gi — non sommables, le prix de chaque unité étant pf — respectivement pi 
Seules les valeurs des divers biens sont sommables . On peut définir un 


indice élémentaire de valeur qui retrace l’évolution de la valeur sous 
l'influence simultanée des variations de prix et de quantité 


D piar 
Vo Y pédi 


Pour séparer les deux influences et chiffrer les variations « moyennes » 
des prix et celles des quantités, il est nécessaire de recourir à des indices syn- 
thétiques. Le problème est de décomposer la variation entre la situation 0 et 
la situation f en ce qui est dû à la variation des prix et en ce qui est dû à la 
variation des quantités vendues. 


Première idée : 

Quelle aurait été la recette (ou la dépense) si les prix étant restés ce qu’ils étaient 
à la date O, les ventes (ou les achats) avaient été celles (ou ceux) de la date r? 

Cela revient à mesurer seulement l’effet de la variation des quantités 


D Pia 
L,y0(q) = —— 


On définit IT,,, (p) tel que : 


Dr 
Vo = L;0(4): Up) = Hp) = -—— 
D pig 


On peut aussi proposer l’autre solution suivante : 


Spigi pa; 
Vi = Loo(p)- ILyo(g) = 2— : 2 — 
1/0 1/0 1/0 > iai > piai 


L 
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L(p) et L(g) sont les indices de Laspeyres des prix et des quantités, IT(p) 
et II(g) sont les indices de Paasche des prix et des quantités !. 


Essayons d’exprimer littérairement la différence entre l’indice de Laspey- 
res et l’indice de Paasche. Pour un indice des prix par exemple 


* indice de Laspeyres :onfigele panier? dans sa composition de la 
période de base et on compare la valeur qu’il aurait à la période courante 
avec sa valeur réelle à la période de base ; 

* indice de Paasche : on fige le panier dans sa composition de la période 


courante, on calcule rétrospectivement ce qu’aurait été sa valeur à la 
période de base et on la compare avec sa valeur actuelle. 


B u Formules développées 
1) Indice de Laspeyres 


Dar un 
L,/yo(P) = : = ee 


S'api Da Po 
GoPo_ _ oPo 
DXUEEEL 


de détail, comme le coefficient budgétaire (structure de valeurs) du produit 
«i», c’est-à-dire la part de dépense totale qui lui est consacrée, à la période 
de base. On constate que la somme de ces pondérations est égale à 1. L'indice 
de Laspeyres des prix apparaît comme une moyenne arithmétique pondérée 
des indices élémentaires des prix des biens individuels. 


La pondération k, = s’interprète dans un indice des prix 


On montre de même : 


DATA 


Loto) = = = SL 


Spa TYpidr D 
I i 


1. Étienne Laspeyres (économiste et statisticien allemand d’origine française) et Hermann 
Paasche (statisticien allemand) proposèrent ces formules respectivement en 1864 et 1874. 

2. Panier : expression INSEE, le « panier » par rapport à celui de la ménagère a la particularité 
de contenir aussi des services immatériels (tickets d’autobus, mois de loyer, biens durables 
comme appareils ménagers..….). 
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Ces formules développées apparemment plus compliquées que les pre- 
mières, sont plus pratiques à appliquer ; c’est sous cette dernière forme que 
les instituts de statistique calculent les indices de Laspeyres, les plus fré- 
quemment utilisés. Ils déterminent d’abord les coefficients de pondération, 
structure des valeurs de la période de base, et les appliquent aux indices 
élémentaires de prix ou de quantités relevés mois après mois. 


2) Indice de Paasche 


DEEE 12 gp p 
Se D 
Dan Yaipi.n op) ain, Pi 
i : Pi Î 

L'indice de Paasche des prix ou des quantités est la moyenne harmonique 
des indices élémentaires (de prix et de quantités) pondérée par les structures 
de valeurs de la période courante. 


C. Comparaison des indices de Laspeyres et de Paasche 


On sait que la moyenne harmonique est inférieure à la moyenne arithmétique, 
mais on ne peut comparer les indices de Laspeyres et de Paasche que si les 
coefficients de pondération sont les mêmes. 


L'indice de Paasche est souvent plus petit que l’indice de Laspeyres. En 
effet, si les coefficients ne changeaient pas entre la date de base et la date 
courante, l’indice de Paasche, moyenne harmonique, serait inférieur à celui 
de Laspeyres qui est une moyenne arithmétique. Pour que l’indice de Paasche 
dépasse l’indice de Laspeyres, il faut que les pondérations des indices 
élémentaires tendent à se modifier dans le sens d’un accroissement pour ceux 
qui sont élevés, et d’une diminution pour ceux qui sont faibles. 


Conformément à la loi économique de l’offre et de la demande, les consom- 
mateurs ont tendance à acheter moins lorsque les prix sont élevés et à acheter 
davantage quand les prix baissent. Ce phénomène, appelé parfois la demande 
élastique, n’est valable que dans le cas où les biens ne servent pas de façon 
essentielle. 


Dans le cas de l’indice de Laspeyres, le numérateur DT pi (cf. premiè- 


res formules) est un peu plus fort qu’il ne devrait l’être, car, conformément 
à la loi de l’offre et de la demande, les consommateurs ont tendance à acheter 
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moins de biens de prix élevés et davantage de biens bon marché. II en résulte 


que le coût total sera inférieur à celui donné par DXT p,. Ainsi, l’ indice de 
i 


Laspeyres a tendance à surévaluer une hausse. 


Dans le cas de l’indice de Paasche, les rôles joués par les quantités consom- 
mées pendant l’année de référence et les quantités consommées pendant 
l’année considérée sont diamétralement opposés de ceux joués par ces mêmes 
quantités dans le cas de l’indice de Laspevyres. L’ indice de Paasche a donc ten- 
dance à sous-évaluer une hausse. 


D Exemple 


Entre janvier 2006 et janvier 2010, l’évolution des prix et du nombre 


d'exemplaires de journaux vendus en un mois par une société de presse 
éditant trois journaux mensuels À, B et C a été la suivante : 


Janvier 2006 Janvier 2010 
Prix (en euros) Quantité Prix (en euros) Quantité 
Journal A 2,5 8 000 3 6 500 
Journal B 4 4 000 4,5 5 000 
Journal C 5 2 000 6 1 500 


1) La variation des recettes de la société de presse entre janvier 2006 et 
janvier 2010 est de 10,9 %, en effet : 


51 000 


V - 100 = 
2010/2006 46 000 


-100= 110,9 


11) Cette variation fait intervenir un effet-quantité et un effet-prix qu’on 
peut évaluer en calculant les indices des prix et des quantités de 
Laspeyres et de Paasche : 


Lio1o2006@P) = 117,4 [L510/2006(P) = 116,6 
>  Lo1020060) > [610/2006(P) 

L010/2006(4) = 95,1 I2610/2006(4) = 94,4 
>  L0102006(4) > [610/2006(4) 


li) La variation de la valeur globale peut être décomposée en ses deux 
effets prix et quantité. En effet, à partir de la formule : 


V2010/2006 = 2010/2006) : TD010/2006(9) = L2010/2006(9) : 2010720062) 
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On peut établir le schéma de décomposition donné à la figure 2.1. 


Prix constants 


X AhnP 0e = 43 750 


Effet volume Effet prix 
-49 16,6 % 


Valeur (janvier 2006) Valeur (janvier 2010) 


Zion Pins = = 46000 Effet valeur _Effet valeur Ÿ Goo P2oi0 = = 51 000 
7 100% 9 : 


Effet prix Effet volume 
17,4 % —5,5 


Quantités constantes 
D 006 P2010 = 54 000 
î 


Figure 2.1 — Schéma de décomposition de l’évolution d’un indice de valeur 


D. Indice de Fisher 


Cet indice a été construit à la suite de la recherche d’un indice idéal. 
Définition 
F,,0(P) = NL;/5(P) : [,,0(p) 


Cette définition provient du développement suivant : 
Vao = Luo(p) + Hyo(g) = Ly0(g) + Hop) 


Les indices de Laspeyres et de Paasche étant des nombres positifs, on 
peut écrire : 


Vo = L,,0(p) : ,,0(P) : L;/0(4) : I,,0(4) = V,,0 = F;/0(P) : F,,0(Q) 


Moyenne géométrique des indices de Laspevyres et de Paasche, la valeur 
de l’indice de Fisher est comprise entre les valeurs de ces deux indices. 

Comme l’indice de Laspeyres a tendance à surestimer une hausse de 
prix, tandis que l’indice de Paasche a tendance à la sous-estimer, on en 
déduit que l’indice de Fisher doit donner une meilleure estimation d’une 
hausse des prix. 
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E. Propriétés des indices de Fisher, Laspeyres et Paasche 


* Les indices de Laspeyres et de Paasche ne sont pas réversibles, mais 
1 
Hyo=— = I,,y'Lo4=1 
0/1 
L'indice de Fisher est donc réversible, ce qui en fait un outil privilégié 
dans les comparaisons géographiques. 


+ Ces trois indices ne sont pas transitifs. 

° Agrégation 

Les indices de Laspeyres et de Paasche ont des structures de moyenne. On 
peut calculer la moyenne arithmétique d’un ensemble à partir des moyennes des 
sous-ensembles qui le composent. Il en résulte que l’indice de Laspeyres (resp. 


de Paasche) d’un ensemble peut s’obtenir à partir des indices des groupes for- 
mant cet ensemble en leur appliquant la formule de Laspeyres (resp. de Paasche). 


Les 303 postes de dépenses, répartis en 159 groupes, servant aux calculs 
des indices actuels des prix à la consommation, base 100 en 1998, font l’objet 
de regroupements en 12 fonctions (ex : 01 produits alimentaires et boissons 
non alcoolisées) et 37 sous-fonctions (ex : 01.1 produits alimentaires) !. C’est 
la formule de Laspeyres qui est utilisée. On commence par calculer l’indice 
de Laspeyres de chacun des regroupements. On obtient ensuite l’indice 
d’ensemble en appliquant à nouveau la formule de Laspeyres à ces sous-indi- 
ces, avec des coefficients de pondération égaux aux parts de chacun des 
regroupements dans la valeur de la consommation totale. Cette propriété per- 
met de publier non seulement un indice global, mais aussi des sous-indices 
correspondant aux groupes et sous-groupes. 


Qualité Laspeyres Paasche Fisher 
Réversibilité non non oui 
un. — 1 TT, = Il 
mais : Li,, = [ mais : [l,,, = F. 
1/0 1/0 
Transitivité non non non 
Agrégation oui oui non 
Emploi couramment utilisé peu utilisé quasiment 
inusité 


1. « Le nouvel indice des prix à la consommation, année de base 1998 », Bulletin Mensuel de 
la Statistique, n° 2-1999, INSEE. 
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F. Utilisation de ces trois indices 


L'indice de Laspeyres est le plus commode à utiliser ; la plupart des indices 
courants établis par les instituts du monde entier sont du type « Laspeyres ». 


L'indice de Paasche, symétrique de celui de Laspeyres quant à sa signifi- 
cation, présente des inconvénients pratiques à cause de la mise à jour perma- 
nente de ses pondérations. Il n’est, de ce fait, pas utilisé dans le calcul direct 
des indices courants. Son calcul est néanmoins intéressant pour obtenir avec 
l’indice de Laspeyres une fourchette d’estimation. 


L'indice de Fisher est quasiment inusité, car son calcul ne peut pas se faire 
par agrégation progressive. 

Lorsqu'on divise un indice de valeur par un indice de Laspeyres de prix 
(resp. de quantités), on obtient un indice de Paasche de quantités (resp. de 
prix). Si on déflate! l'indice rendant compte de l’évolution de la masse sala- 
riale (indice de valeur) par un indice de Laspeyres des prix (se rapportant 
évidemment aux mêmes dates), on obtient un indice de pouvoir d’achat de la 
masse salariale qui est un indice de Paasche des quantités consommables. 


On dispose assez souvent de séries de valeur totale : chiffre d’affaire, 
montant des investissements. Pour obtenir les indices de volume correspon- 
dants représentatifs de l’évolution réelle compte tenu des variations des prix, 
il faut diviser les indices de valeur par les indices de prix correspondants. 
Mais, on n’obtient pas un indice de Paasche de volume puisque l’indice des 
prix utilisé en France — et dans la plupart des pays étrangers — n’est pas un 
indice de Laspeyres, mais un indice-chaîne de Laspeyres. 


LR Indices-chaïnes 


A. Raccord d'indices 


Les indices ont une durée de vie limitée en raison de l’évolution des structures 
économiques. Lorsqu’on veut décrire l’évolution d’une grandeur complexe 


1. Déflater : annuler la hausse due à l’effet de l’inflation. 

La déflation du revenu nominal par l'indice des prix à la consommation permet de raisonner 
en revenus constants en évitant l'illusion monétaire, et de comparer les niveaux de vie à des 
périodes différentes sans tenir compte d’une augmentation du revenu ne compensant que la 
hausse des prix. 
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sur une longue période, on est amené à se poser le problème du raccord de 
deux séries d’indices synthétiques consécutives. 


Soit un indice /, base 100 à la date O, calculé jusqu’à la date f où il a été 
remplacé par un indice /*. La valeur de 7 à une date r” postérieure à la date f 
s’évalue en multipliant l'indice Z*,, par l’indice J,,, : 


Leo = y: Lo 
Cette formule, obtenu par un raccord d’indice, n’est qu’une approximation, car: 
* les indices synthétiques ne possèdent pas la propriété de circularité ; 


*ilest fréquent que les indices 7 et /* n’aient ni le même champ, ni la 
même composition (changement du nombre d’articles dû à l’introduction 
de produits nouveaux.…..). 


B u Les indices-chaînes 


Pour évaluer l’évolution d’une grandeur complexe sur une longue période, 
l’emploi de la formule de Laspeyres présente un inconvénient, car la pondé- 
ration vieillit. Les préférences des consommateurs comme les procédés 
auxquels recourent les producteurs se modifient  : les articles choisis pour 
représenter l’évolution de certaines catégories de biens cessent d’être bien 
adaptés à cet objectif et les pondérations de la période de base et de la période 
courante deviennent trop différentes pour que la comparaison reste valable. 


On a donc proposé de calculer des indices dont la base changerait à cha- 
que période. 
Mais, comment comparer alors la situation entre deux dates où ont été calcu- 


lés deux ou plusieurs indices ayant des bases différentes ? On adopte une solution 
parfaitement empirique : le raccordement entre ces indices intermédiaires. 


Les indices-chaînes résultent de la généralisation de l’opération de rac- 
cord de deux indices. Ce sont des indices définis à partir du produit des indi- 
ces ayant pour base l’année précédente. L’indice-chaîne de Laspeyres est un 
produit d’indices de Laspeyres, mais n’est pas un indice de Laspeyres 


t 
CL,,0o = IL: > CL, =L,; 1 CL; 
i=1 
On définit de même l’indice-chaîne de Paasche. 


L’indice-chaîne permet, mieux que les indices de Laspeyres ou de Paas- 
che, de suivre l’évolution de la grandeur étudiée entre deux dates successives. 
Si chaque maillon est calculé selon la formule de Laspeyres 


LÉ 
CL,» = L,,_ alors que : 9 L,}-1 
CL;_i» L,_i 
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On est donc dans d’excellentes conditions pour comparer deux périodes 
successives. 


On a la même propriété si chaque maillon est un indice de Paasche. Par contre: 


* toute erreur sur l’un des éléments de la chaîne se retrouve dans tous les 
indices suivants ; 

* l’indice obtenu n’a pas une signification bien précise, le résultat dépen- 
dant des modifications des pondérations d’une période à l’autre. 


Un indice-chaîne sera donc moins bien adapté qu’un indice de Laspeyres 
ou de Paasche pour étudier les variations survenues depuis la période de base. 


C. Indices publiés par l'INSEE 


Les principaux indices publiés par l’INSEE ! sont les suivants : 
* indices des prix : prix à la consommation, prix de gros ; 
- indices du commerce extérieur ; 
* indices de la production industrielle ; 
* indices boursiers. 


Les indices des prix à la consommation des ménages (IPC) calculés par 
l'INSEE sont des indices-chaînes de Laspeyres. L’INSEE publie chaque 
mois plusieurs indices des prix, base 1998. L’indice des ménages urbains 
dont le chef est ouvrier ou employé (métropole et DOM) sert, dans sa version 
«hors tabac », à l’indexation du SMIC. Les autres indices concernant 
l’ensemble des ménages ont un usage économique dans leur version « y com- 
pris tabac » et un usage indexation dans leur version « hors tabac ». 


L'indice des prix à la consommation harmonisé (IPCH)) sert aux compa- 
raisons internationales. 


IV. Traitement statistique des indices 


Pour représenter certains phénomènes, on peut être amené à graduer les axes 
selon des échelles particulières. Le papier semi-logarithmique est particuliè- 
rement adapté à certains types de séries chronologiques, et les séries écono- 

miques sont souvent des séries d’indices. 


1. www.insee.fr/fr/themes 
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A. Echelle logarithmique 


Le papier semi-logarithmique comporte un axe des abscisses à échelle arith- 
métique et un axe des ordonnées à échelle logarithmique. Sur l’axe des abs- 
cisses, on peut choisir l’origine et une unité de longueur quelconque. Mais 
pour l’axe des ordonnées, on utilise une échelle logarithmique ; la place des 


nombres est fixée par leur logarithme décimal (cf. figure 2.2) : 


Figure 2.2 - Construction d’une échelle logarithmique 


Nombre 2 3 4 5 6 7 8 9 10 
log 0,301 | 0,477 | 0,602 | 0,699 | 0,778 | 0,845 | 0,903 | 0,954 1 
Échelle Échelle x 10 x 100 
arithmétique  logarithmique 
1 10 100 1000 
9 90 900 
0,9 8 80 800 
T 70 700 
0,8 6 60 600 
0,7 5 50 500 
0,6 4 40 400 
0,5 3 30 300 
0,4 
0,3 2 20 200 
0,2 
0,1 
ot Le 1014 100 


Sur une échelle logarithmique, la distance séparant deux multiples succes- 
sifs de dix est toujours la même puisque : 


log 10€ — log 104-1 = log 10 


et à l’intérieur d’un module, la place des nombres est donc fixée par leur 
logarithme décimal (cf. figures 2.2 et 2.4). 


log 10#+1 og 10K = log 10 


L’intervalle entre deux puissances successives de 10 s’appelle un module 
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Les papiers semi-logarithmiques ont habituellement 2, 3 ou 4 modules  ; 
un papier à trois modules permet de représenter des séries temporelles x, dont 
le rapport entre la plus grande et la plus petite valeur est au plus de 10 3. Les 
représentations graphiques des logiciels usuels (Excel  ®...) offrent directe- 
ment la possibilité d'utiliser les échelles logarithmiques. 


B. Propriétés d'un graphique à ordonnée logarithmique 


Une grandeur dont le taux d’accroissement (ou de diminution) est constant 
sur des laps de temps égaux a son évolution représentée sur du papier à 
ordonnée logarithmique par une suite de points alignés (cf. figure 2.3). 

En effet, si une grandeur x a un taux de variation annuel  i constant, la 
valeur x, de x à la date initiale prend, après f années, la valeur x, telle que : 


X=Xo(l+i) — log x,=log x + f log(l + i) 


x= (1 + 0,5) 10 À l99* 
8 
7 
6 
5 
4 
3 
2 
1 
0 L 
0 L 2 3 4 5 t 0 L 2 3 4 5 t 
Ordonnée arithmétique Ordonnée logarithmique 


Figure 2.3 — Grandeur à taux de croissance annuel constant 


Une représentation avec une ordonnée logarithmique permet : 


° la détermination graphique du rapport entre deux valeurs de la variable 
pour en déduire le taux de variation entre les deux dates considérées ; une 
différence de logarithme représentant un rapport, celui-ci est égal à la dif- 
férence des ordonnées entre les deux valeurs de la variable ; 

° la détermination graphique du taux moyen de variation à, la pente de 
la droite joignant les deux points extrêmes ( cf. figure 2.4a) étant égale 

à(1+i); 

° la comparaison graphique entre les taux de variation de deux grandeurs 

représentées sur le même graphique à ordonnée logarithmique ; deux droi- 
tes parallèles indiquent des taux de variation égaux ; 


° la représentation des séries aux variations importantes puiqu’avec qua- 
tre modules, on peut représenter une série variant de 1 à 10 4. 
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V,. Bilan 


Un indice n’est ni parfait, ni rigoureux, ni parfaitement représentatif ; en fait, 
il existe autant d’indices que le statisticien veut en construire, et chacun a la 
signification qui résulte de son calcul même. Parmi tous ces indices, l’éco- 
nomiste choisira celui qui lui paraît le mieux correspondre à l’usage qu’il 
veut en faire. 


Pour construire un indice synthétique, on est amené à faire quatre choix 
° deux choix d'ordre économique : 

— choix des grandeurs entrant dans la composition de l’indice, 

— choix de la période de référence ; 


° deux choix d'ordre statistique : 


— choix de la moyenne à utiliser pour le calcul de l’indice à partir des 
grandeurs composantes, 


— choix de la pondération à appliquer aux valeurs des grandeurs afin de 
tenir compte de leur importance relative. 


INDICES STATISTIQUES e 61 


Testez-Vous (es réponses sont données page 284) 


Il y a au moins une réponse exacte par question. 

1. L’indice de Laspeyres des prix est : 

a) un indice des dépenses 

b) une moyenne arithmétique d’indices élémentaires 
c) l'indice des prix actuellement calculé par l'INSEE 
d) s’exprime dans une unité monétaire 

2. L'indice de Paasche est : 

a) n’est pas un indice des prix 

b) transitif 

c) une moyenne harmonique d’indices élémentaires 
d) au plus égal à l’indice de Laspeyres 

3. Un indice des dépenses est : 

a) un indice de valeur 

b) réversible 

c) transitif 

d) un indice de prix 

4. Une grandeur mesurée tous les ans : 


a) est représentée sur un papier semi-logarithmique par une suite de points alignés si 
le taux annuel de variation est constant 


b) a un taux annuel moyen de variation qui peut être déterminé graphiquement 


c) a un taux annuel moyen de variation égal à la moyenne arithmétique des taux 
annuels de variation 


d) est représentée sur un papier à échelles arithmétiques par une suite de points ali- 
gnés si l’accroissement annuel est constant 


5. Les taux annuels moyens de croissance du PIB en volume en France ont été 
les suivants de 1997 à 2002 (source : Tableaux de l'Économie française, 
INSEE) : 


Année 1997 | 1998 | 1999 | 2000 | 2001 | 2002 


Taux annuel moyen de croissance (en %)| 2,0 3,2 2,9 3,8 2,1 1,2 


a) le taux de croissance sur les cinq années est la somme des cinq taux de croissance 


b) le taux annuel moyen de croissance sur la période 1997 — 2002 est égal à la 
moyenne arithmétique des taux annuels moyens de croissance 


c) le taux annuel moyen de croissance sur la période 1997 — 2002 se calcule à l’aide 
d’une moyenne géométrique 


d) pour la période 1999 — 2001, le taux de croissance du PIB en volume a été de 9 % 
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Exercices (corrigés page 297) 


Exercice 2.1 
Une entreprise utilise pour ses fabrications trois types de matières premières qui sont 
notées respectivement À, B et C. 


En 2000 et 2004, les prix observés et les quantités achetées par cette entreprise ont 
été les suivants : 


Matières Prix par tonne Poe Prix par tonne et 
premières | en euros 2000 en 2000 en euros 2004 en 2004 

A 800 10 900 6 

B 500 4 700 4 

C 600 5 600 8 


1. Calculez les indices élémentaires rendant compte de l’évolution des prix de cha- 
cune des matières premières entre 2000 et 2004. 


2. Calculez la moyenne arithmétique des indices élémentaires précédents pondérée 
par la part des dépenses engagées par l’entreprise pour chacune de ces matières 
premières en 2000. De quel indice s’agit-il ? 

3. Effectuez le même calcul pour rendre compte de l’évolution des quantités entre 
2000 et 2004. 


4. Calculez l’indice mesurant l’évolution globale des dépenses de matières premières 
entre 2000 et 2004. 


5. Déterminez, en utilisant les résultats des questions précédentes, les taux de varia- 
tion (exprimés en pourcentage) des prix, des quantités et de la dépense totale. 
Comment s’explique l’évolution de la dépense totale ? 


Exercice 2.2 

Entre 1980 et 2000, les quantités de sel extraites d’une mine ont été multipliées par 
1,5 entre 1980 et 1985, sont passées de l’indice 130 en 1985 à l’indice 168 en 1992 
avant d'augmenter de 6 % par an entre 1992 et 2000. 


1. Quel est le taux annuel moyen de variation des quantités de sel extraites entre 
1980 et 2000 ? 

2. Au cours de la même période, le taux de variation annuel moyen du prix du sel a 
été de — 5 %. Quelle est la valeur de l’indice du chiffre d’affaire en 2000, base 
1980 ? 
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Exercice 2.3 


Ce tableau donne les indices trimestriels des salaires horaires de base de l’ensemble 
des ouvriers (secteurs non agricoles), base 100 au # trimestre 2008. La série est rétro- 
polée depuis le 4° trimestre 1998 (Source : INSEE) : 


1999 2000 2001 2002 2003 
31 mars 72,3 76,1 79,4 82,5 84,8 


30 juin 72,8 76,8 80 83 85,3 
30 septembre 73,7 77,6 80,8 83,7 86,1 
31 décembre 74,4 78,1 81,3 84,1 86,4 


2004 | 2005 | 2006 | 2007 | 2008 | 2009 
31 mars 87,1 89,7 92,5 95,2 97,9 100,8 
30 juin 87,6 90,2 93,1 95,8 99 101,2 

30 septembre 88,6 91,4 94 96,6 99,7 101,7 

31 décembre 88,9 91,8 94,3 97 100 


Sachant que cet indice vaut 71,9 au 31 décembre 1998, calculez le taux trimestriel 
moyen de croissance entre le 31 décembre 1998 et le 30 septembre 2009, et le taux 
annuel moyen de croissance entre le 31 décembre 1998 et le 31 décembre 2008. 


Exercice 2.4 


Le tableau suivant est un extrait du tableau « Production et valeur ajoutée de l’agri- 
culture » : 


2008 2008/2007 en % 
. Volume Prix Valeur 
Produits végétaux 38,2 3,6 ? — 0,3 
Céréales 10,7 19,2 — 21,3 — 6,2 
Oléagineux, protéagineux 2,4 4,8 ? 3,2 
Betteraves industrielles 0,8 — 7,2 — 3,4 — 10,3 
Autres plantes industrielles* 0,3 — 2,9 13,5 10,3 
Fruits, légumes, pommes de terre 7,4 — 3,1 6,3 3,0 
Vins 9,4 ? 3,7 —2,1 
Fourrages, plantes, fleurs 7,4 — 1,2 9,7 8,4 


* Tabac, lin textile, houblon, canne à sucre, etc. 


Source : Tableaux de l'Économie française, édition 2010. 
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1. Donnez l'indice de valeur de la production des « Produits végétaux » en 2008, 
base 100 en 2007. Même question pour «  Oléagineux, protéagineux » et pour 
« Vins ». 


2. Calculez l’évolution 2008/2007 (en pourcentage) des prix à la production des 
« Produits végétaux ». Même question pour « Oléagineux, protéagineux ». 


3. Calculez l’évolution 2008/2007 (en pourcentage) du volume de la production des 
« Vins ». 


4. Commentez les résultats obtenus. 


Exercice 2.5 


Considérons la consommation médicale totale en France (en milliards d’euros cou- 
rants) de 1970 à 2000 ( Source : Tableaux de l'Économie française , INSEE). 


Année CM Année CM Année CM 
(milliards (milliards (milliards 
d'euros) d'euros) d'euros) 
1970 6,494 
1971 7,516 1981 35,399 1991 87,430 
1972 8,568 1982 41,146 1992 93,482 
1973 9,833 1983 46,848 1993 98,665 
1974 11,586 1984 52,000 1994 101,866 
1975 14,452 1985 57,046 1995 106,257 
1976 16,815 1986 61,711 1996 109,245 
1977 18,812 1987 64,776 1997 111,059 
1978 22,547 1988 70,447 1998 112,731 
1979 26,084 1989 76,377 1999 117,093 
1980 30,215 1990 81,911 2000 123,545 
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1. Calculez la variation relative (en %) de la consommation médicale entre 1970 
et 2000. 


2. Calculez la série des indices de la consommation médicale base 1970. 


3. Représentez la série des indices sur un graphique à ordonnée logarithmique, et 
calculez le taux annuel de croissance de cet indice pendant la période 1970-1982. 


4. Représentez la série des indices sur un graphique à ordonnée arithmétique, et cal- 
culez l’augmentation annuelle moyenne entre 1982 et 2000. 


5. Étude de l’évolution de l'indice en volume : 


— sachant que l'indice des prix 19:70 est égal à 318,7, calculez la variation de 
l’indice en volume entre 1970 et 1982, et en déduire le taux annuel moyen de 
variation de cet indice entre 1970 et 1982 ; 
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— sachant qu’on utilise le coefficient de raccordement ! de 5,584 pour calculer un 
prix en 2000 à partir d’un prix en 1970, calculez le taux annuel moyen de crois- 
sance de l’indice en volume entre 1982 et 2000. 


6. Conclusion. 


1. http://www.insee.fr/fr/indicateur/achatfranc.htm 


66 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


3. Distributions 


statistiques 
à deux caractères 


res, et lorsqu'elles sont trop nombreuses pour qu'on les cite une 

à une, on les présente sous la forme d'un tableau à double 
entrée. On définit alors la distribution conjointe, les distributions margji- 
nales et les distributions conditionnelles. L'étude de la distribution de 
deux variables se pousuit par celle de leur liaison. 
L'étude de la liaison entre les variables observées, appelée communé- 
ment l'étude des corrélations, dépend de leur nature. On envisagera les 
trois cas suivants : deux variables quantitatives, une variable quantitative 
et une variable qualitative, deux variables qualitatives . Lorsque le 
domaine de variation d'une variable quantitative a été découpé en clas- 
ses et que les observations sont présentées dans un tableau à double 
entrée, alors cette variable peut être traitée comme une variable quali- 
tative et dans ce cas, on a plusieurs méthodes pour l'étude de la liaison. 


[ orsque les observations portent simultanément sur deux caractè- 


Distributions statistiques à deux variables 


A. Distribution conjointe 


Désignons par X et Y les deux variables qui peuvent être qualitatives ou quan- 
titatives, et qui peuvent ne pas être de même nature. Les  k modalités de X 
sont désignées par x,,...,x;,,... ,x, : les / modalités de Y sont désignées par 


Yr- 


asie a) La modalité d’une variable désigne le centre de laic classe 


dans le cas d’une variable quantitative continue. 
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La répartition des n observations, ou distribution conjointe , suivant les 
modalités de X et Y se présente sous forme d’un tableau à double entrée, 
appelée fableau de contingence (cf. tableaux 3.1 et 3.2). 


Tableau 3.1 — Tableau de contingence : distribution conjointe de deux variables X et Y 


Modalité de Y 
| Yi ue y; . Y] Total 
Modalité de X 
x ni] 7. ni; ni] ni. 
x; n;] njj ñ; Ni. 
Xk Ml L ny L W7 Me 
Total n.. cie n.; Le n,] n 


Tableau 3.2 — Exemple de tableau de contingence : distribution des notes de 100 étudiants 
à une épreuve d’un concours selon leur filière d’origine 


Classe de notes Y [0 ; 6[ [6 ; 10[ [10 ; 14[ [14:20] Total 
3 8 12 17 
Filière d’origine X 
Filière À 26 6 4 1 37 
Filière B 12 9 3 1 25 
Filière C 1 4 5 6 16 
Filière D 10 8 3 1 22 
Total 49 27 15 9 100 


L’effectif n;; désigne le nombre de fois où la modalité x; de la variable X 
et la modalité y; de la variable Y ont été observées simultanément. 


L’effectif n;, est le nombre total d'observations de la modalité x ; de X, 
quelle que soit la modalité de Y : 


De même, l'effectif n,;est le nombre total d'observations de la modalité y; 
de Y, quelle que soit la modalité de X 


K 
no; — D 


i=l 
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k l 
On a évidemment : > n;. = > CR, 
i=1 j=1 
La distribution conjointe peut aussi être définie par les fréquences 
ñn: 


fy = 


n 


B. Distributions marginales 


Les k couples (x;, n;) forment la distribution marginale de la variable X. 
Les / couples O;,n. ) forment la distribution marginale de la variable Y. 


Les distributions marginales peuvent aussi être données sous forme de fré- 
quences : 


n; n 


ie et Fe = .j 
n n 


Disposant d’une distribution conjointe, on peut déduire les distributions 
marginales qui permettent d’étudier séparément chaque variable en représen- 
tant graphiquement sa distribution et s’il s’agit d’une variable quantitative, en 
calculant ses caractéristiques de tendance centrale, de dispersion, de forme... 


C. Distributions conditionnelles 


La distribution de la variable  Y, la ne . X étant égale à x; est appelée 
distribution conditionnelle de Y pour X = 


le re 


Cette distribution des n;, observations, satisfaisant à la condition X = x;, 
est présentée sous la forme de fréquences conditionnelles 


l 

h;; 

Le . avec : D fin = ] 
le 


j=1 


Y/X = X; Yi y; sas Y] Total 


Fréquence Jr Ji er fi 1 
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La fréquence! f; se lit « f indice j si i », c’est-à-dire fréquence de y; si 
X = x;.Il y a k distributions conditionnelles de Y pour X = x; (i= 1,...,k). 

Lorsque la variable Y est quantitative, on peut calculer pour chaque valeur 
x; Sa moyenne conditionnelle y; et son écart-type conditionnel s, : 


l l 
nn ge 9 
Yi = D fn y; et S; = D fn (@;-»:) 
j=1 j=1 
Les k modalités de X induisant une partition des observations en k sous- 
groupes, la moyenne y peut s’exprimer comme somme pondérée des k 
moyennes y; (chapitre 1) : 


Symétriquement, on a / distributions conditionnelles de X et on définit les 
fréquences conditionnelles f indice i si j : 


k 
ñ.. 
fu = _æ avec : Dr? = | 


1 i=1 


XY =); X] 7e x; sé X4 Total 


Fréquence Ji ss Ji sé Jrj 1 


Lorsque la variable X est quantitative, on peut calculer pour chaque valeur 


y; Sa moyenne conditionnelle x; et son écart-type conditionnel s; : 


k k 
ere in. 1% 
X; = D fi X; et Si = >. (x; x;) 
i=l i=l 
et on a la relation suivante entre la moyenne x et les / moyennes condition- 
nelles x; : 


l 
X = 7 fe j À; 
j=1 
Lorsqu'on dispose d’observations portant simultanément sur deux varia- 
bles, il est fréquent de les présenter dans un tableau donnant l’ensemble des 
distributions conditionnelles de Y, et on a alors un tableau dont toutes les 


1. Les fréquences /;; sont aussi parfois notées f u 
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sommes en ligne sont égales à 100 % ; ce tableau est appelé fableau des pro- 
fils en ligne (cf. tableau 3.3). 


Tableau 3.3 -Tableau des profils en ligne correspondant au tableau de contingence 3.2 


Classe de notes Y [0 ;:6[ [6 ; 10[ [10 ; 14[ [14 ;20] 
3 8 12 17 Total 
Filière d’origine X 

Filière À 70,3 16,2 10,8 2,7 100 

Filière B 48,0 36,0 12,0 4,0 100 

Filière C 6,3 25,0 31,2 37,5 100 

Filière D 45,5 36,4 13,6 4,5 100 
Distribution marginale de Y 49,0 27,0 15,0 9,0 100 


Bien évidemment, on définit d’une façon symétrique le fableau des profils 
en colonne qui est le tableau des distributions conditionnelles de X avec des 
sommes en colonne égales à 1 ( cf. tableau 3.4). 


Tableau 3.4 -Tableau des profils en colonne 


Modalité de Y Distribution 
Yi sa y; —. Y marginale 
Modalité de X de X 
X1 fin F8 fi jé fa Ji. 
x; Jin fig Jia f 
X£ Jan ni Ter dé frn Je 
Total 1 1 1 1 


D. Dépendance et indépendance statistique 


Si tous les profils en colonne du tableau 3.4 sont identiques, cela signifie que 
la distribution de la variable X ne dépend pas de la variable  Y, on dit alors 
que les variables X et Y sont statistiquement indépendantes dans l’ensemble 
des n individus considérés, et dans ce cas toutes les distributions condition- 
nelles de X sont identiques à la distribution marginale de X. 
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On peut écrire en termes d’effectifs ou de fréquences ce que signifie 
l'indépendance statistique entre X et Y ; pour tout couple ( à, j) : 
Le me, 


fn = fes f=f. ff, Sn;= 
ie n 

Par raison de symétrie, l’indépendance statistique entre  X et Y implique 
aussi des profils en ligne identiques à la distribution marginale de Fe 
Jjx = f.; pour tout couple (à, j). 

Lorsque deux variables dépendent statistiquement l’une de l’autre, on 
cherche à évaluer l’intensité de leur liaison et dans le cas de deux variables 
quantitatives, on examine si on peut les considérer liées par une relation 
linéaire. 


Il. Deux variables quantitatives 


Si les observations de deux variables statistiques X et Y sont connues indivi- 
duellement, on commence par les visualiser en les représentant sous la forme 
d’un nuage de points (cf. figure 3.1) : dans un repère cartésien, chaque obser- 
vation (x;, y.) est figurée par le point M; de coordonnées (x:;, y,), et la forme 
du nuage donne une information sur le type d’une éventuelle liaison. 


Figure 3.1 - Nuage de points 


Supposons que l’examen du nuage de points conduise à rechercher une 
droite d’ajustement. Le calcul des coefficients de cette droite va être exposé 
dans le cas où les observations sont connues individuellement. La généra- 
lisation des résultats au cas d’une distribution résumée dans un tableau de 
contingence se fait sans difficulté. 


72 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


A. Caractéristiques d'un couple 
de deux variables quantitatives 


1) Moyenne d'une somme de deux variables statistiques 


On montre sans difficulté le résultat suivant : x+y = x + y 


=  Va,b,ceR ax+by+c = ax+by+c 


2) Covariance entre deux variables statistiques 


Cas de données individuelles : 


1 n . : l n D 
cov(x,r) = LV Gr 5)n- 5) = L'Vxp-x y 
(X) = > 2 : D 
Cas de données groupées dans un tableau de contingence (covariance 
pondérée) : 
k k 


l ! 
covxr= DD Gi, 7) = YYfixri-x.7 


i=lj=1 i=lj=1 


Propriétés de la covariance 


1. cov(X, Y) = cov(Y, X) 

2. cov(X, X) = var(X) 

3. var(X + Ÿ) = var(X) + var(Y) + 2 cov(X, Ÿ) 

4. Va, b, c, x, Yo € R : cov(aX + Xo: bY + yo) = ab cov(X, F) 
= var(aX + bY + c) = a2 var(X) + b2 var(Y) + 2ab cov(X,Y) 


5. |cov(X, Y)| < 4/var(X) - var(Y) 


Les propriétés 1 et 2 sont évidentes. Montrons la propriété 3 dans le cas 
de données individuelles, la démonstration pour des données groupées dans 
un tableau de contingence se faisant de la même façon en utilisant les formu- 
les pondérées par les fréquences : 


= _—; i À : 9 
ul X; + EXT = — (x; +y;,—x+ y) 
LDG+r-rr = LE 


= i=1 


var(X +Y) 


De-neSo- nano) 


n\i2i i=1 i=1 


= var(X) + var(Y)+2cov(X, Y) 
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La propriété 4 se démontre sans difficulté si on se souvient que 
aX+Xo = ax + X,. Quant à la propriété 5, elle sera démontrée au $ IIL.C.I1. 


3) Coefficient de corrélation linéaire 
On appelle coefficient de corrélation linéaire entre deux variables statistiques 
X et Y, le rapport de leur covariance par le produit de leurs écarts-types 
COV(X, Y) 

Sx° Sy 


r(X, Y) = 


Propriétés du coefficient de corrélation linéaire 


On a pour tout a, b, xo, Yo € R : 


XF bY + 
r(aX + xo , bY + yo) = cov(aX + Xo; Yo) _ abcov(X, Y) 
SaX+x9 j Sbr+yo lab|sy "Sy 


__ J-+r(X, Y) si a et b de même signe 
—r(X,Y) si a et b de signe opposé 


Ce coefficient, invariant par changement d’origine et d'échelle , est un 
nombre sans dimension qui, d’après la propriété 5 de la covariance, varie 
entre — 1 et+ 1. On montrera que s’il est égal à +1,les n points (x; , y;) 
sont alignés. 


B. Ajustement linéaire d'un nuage de points 


Les points (x; , y;) forment un nuage dont on cherche une approximation dans 
un but de simplification. Mais qui dit simplification dit déformation : nous 
voudrions qu’elle soit minimale ; encore faut-il préciser ce que l’on entend 
par là. Disons tout de suite que le choix du critère sera arbitraire même si 
l’on tente de le justifier par des considérations plus ou moins «  intuitives ». 
On peut vouloir par exemple : 

e préserver au mieux les distances entre points ; 

e préserver au mieux les angles des droites joignant les points. 

Il n'existe pas de moyen de satisfaire à toutes ces exigences à la fois. Il 
nous faut donc choisir. 

Nous allons chercher la meilleure droite au sens des moindres carrés , 

n 
À + : 

c’est-à-dire telle que : > |M;H° soit minimum (cf figure 3.2) : 


i=1 
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Figure 3.2 — Interprétation géométrique de la droite des moindres carrés 


Les distances sont comptées parallèlement à l’un des axes des coordon- 
nées ; nous avons choisi ici l’axe des ordonnées ( cf. figure 3.2). 


Il s’agit de déterminer la droite D d’équation {y = ax + b} telle que : 


n 2 
F(a, b) = > (:- (ax; + b)) soit minimum 
i=] 
Nos inconnues sont a et b. 


Commençons par chercher le minimum de F(a, b) relativement à b lorsque 
a est fixé. On peut écrire F(a, b) comme un trinôme du second degré en b: 


F(a, b) DC — aX;) — 2] = DC — ax;)?—2b(y;- ax;) + 2) 


i=1l i= 


D 'O:-ax)?-2bY (y;-ax;) 41h? 
i=1 i=1 


Quand a est fixé, le dernier membre constitue une fonction de b qui atteint 


son minimum pour b = b tel que (a b) = 0, soit : 


° 1e conséquence : la droite des moindres carrés passe par le point de 
coordonnées (x, y) qu’on appelle parfois le centre de gravité ou point 
moyen du nuage. 
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Notre problème est maintenant de trouver le minimum de F(a, b) relati- 
vement à a: 


n 


S (0-5 -a6-0) 


i=1 


F(a, b) 


SO 7-2 Ÿ Gi PJ 7) + Ÿ (x 7) 


i=1 i=1 i=1 


ce qui peut encore s’écrire : 


F(a, b) L 10 var(X) —2a cov(X, Y) + var(r)) 


Le coefficient de a? étant positif ou nul, ce trinôme du second degré en 
a atteint son minimum relativement à a pour a = à avec: 
4 = COV(X, Y) 
var(X) 
Ainsi le couple (à, b) avec b = y—aàx réalise le minimum de la 
fonction F 
°22 conséquence : la droite des moindres carrés a pour équation 
y = ax+b soit 
— COV(X, Y - 
y-y = MED .(x-x) 
var(X) 


On posera pour tout à variant de 1 à n:ÿ;, = ax;+b, ÿ;estla valeur 
estimée de Y par la droite des moindres carrés lorsque X = x; 


C. Interprétation du coefficient de corrélation linéaire 


1) Interprétation à l'aide de la droite D 


Il est toujours possible de tracer la droite des moindres carrés précédente 
quelle que soit la forme du nuage. L’approximation du nuage par cette droite 
est-elle légitime ? Quel sens, quelle signification donner à cette droite 7? 


C’est là une autre question, et fort importante. On pourra dire qu’il 
est d’autant plus légitime de remplacer le nuage par la droite trouvée que 
la dispersion du nuage de points par rapport à la droite des moindres 
carrés : 
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SM | = F(a,b) = DGi-5) sera plus faible 


i=]l i=l 


En remplaçant a par son estimation &, on obtient : 


a vs, av _ [(cov(X, F)} (cov(X, r)} 
F(a,b}= ÿ O: Yi) = EL 


i=1 


+ vr)] 


2 
- (CURE 
var(X) 
(cov(X, Y)} 
et comme : D = ——— 
var(X) - var(Y) 
on a : 


DOi-5) = nv). (re YGi-SY = Yoi- 7) (1-7) 


i=l i=l is 
ce qui implique : 
1-r2>0 => Jr < +1 et  |cov(X, Y)|< //var(X)- var(Y) 


La quantité y Oi-3Y , appelée Somme des Carrés Résiduelle (SC), 
i=1 
est d’autant plus faible que 7? est proche de 1. 


Elle est nulle pour r = + 1 et dans ce cas, on a une liaison linéaire entre X et 
Ÿ, car si { ÿ; = y, pour tout i}, alors les n points (x;, y) sont alignés. 


n 2 
La quantité » (y; y) étant appelée Somme des Carrés Totale (SC ,4) 
i=1 


de Y, il s’ensuit : 


ŸGi-3) 


1-r = = 


SG 5) 


i=1 


SC 


rés 


S Ciot 


= la quantité {1 -r2?} est égale à la proportion de variation de Y non expli- 
quée par la droite des moindres carrés D (cf. figures 3.3 et 3.4). 
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n =? 
Figure 3.3 — D (y; y) = SC 


i=1 


Xi 


n z 2 
Figure 3.4 — D (;-7) = SC, 


i=1l 


S 


Notons que la somme des écarts à la droite D est nulle : 


y=äx+b = YGi-äx-b20 = YG:-5)=0 


i=1 i=l 


ce qui implique aussi que les moyennes des Ÿ; et des y, sont égales : $ = y 
et ceci est dû au fait que la droite des moindres carrés passe par le point 
moyen (x, y) du nuage des n points. 


La décomposition de la variation totale de Y permet une autre interpréta- 


tion de 72: 


78 


DCE DO 1e El 


i= i=1 


D Gi 3 + D Gi 7) +2Ÿ On PI Gi 5) 


i=1 i=1 i=l 
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Montrons que le 3° terme du dernier membre est nul. On peut écrire : 
Pi y = à(x;-x) et y;-ÿ; = y; y-(ÿ;- y) = y;-y-A(x;-x) 
ce qui donne une nouvelle expression de ce 3 © terme : 


DOG 7) = a 7 -à0-)]a-5) 


i=1 i=1 


= Sc ps-D-4 Qu) 


i=1 i=l 


=> À Gi 3) G:- +) = nälcov(x, Y) ävar(X)) = 0 


i=1 


var(X) 


A  —02 
La quantité > (Ji— y) étant appelée Somme des Carrés Expliquée (SC), 
i=l 


on obtient l’ équation de la décomposition de la variation totale de Y : 


n 0 n : 2 n . 
DO 3) = V7) + Gi) © SC = SCopi + SCus 


i=l i=1 i=1 


et une autre interprétation de r?, complémentaire à celle de (1-72): 


= le carré r? du coefficient de corrélation linéaire est égal à la ne de 
la variation de Y expliquée par la droite des moindres carrés 


Conclusion sur l'interprétation de la valeur du coefficient de corrélation 
linéaire : 


r=tl & y,=ÿ,=aàx,+b Vi 


r=2+tl & les n points (x;,y,) sont alignés 
r=t < pas de liaison linéaire, mais possibilité d’une liaison 
d’un autre type 
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Voici un exemple de deux variables X et Y non indépendantes avec 
r(X, Y) = 0: 
X —2 1 0 1 
Y 4 1 0 1 


n 
n=5, x =0, y=2et D'xiyi = 0 = r(X,Ÿ)= 0e Y = X? 
i=1 
= Le coefficient de corrélation linéaire entre deux variables quantitatives 
indépendantes est nul, mais la réciproque n’est pas vraie 


X et Y indépendantes = r(X, Y)=0 


2) Droite des moindres carrés D 


Dans toute l’étude précédente, on a fait jouer des rôles non symétriques à X 
et à Y. On a procédé comme si la variable X pouvait être mesurée, et qu’on 
cherchait à prévoir la variable Y. 

Inversement, la droite D” des moindres carrés pour laquelle les distances sont 
comptées parallèlement à l’axe des abscisses ( cf. figure 3.5) a pour équation : 


COV(X, Y) — — var(Ÿ) 
2 , = — _ = ———— 
var) V7) 777 7 cov(X, ?) 
Mais, dans certains cas, comme celui où la variable  X désigne le temps, 
seule la droite D a un sens. 


Le coefficient r étant symétrique par rapport à X età Y,la Somme des 
Carrés Résiduelle associée à la droite D? est égale à : 


Ÿ MG? = Ÿ 5) = nvar (X)-(1-7r2) 


i=1l i=l 


X=Xx = -(x—X) 


X; X; X 


Figure 3.5 — Interprétation géométrique de la droite des moindres carrés D”? 
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D. Comparaison des deux droites des moindres carrés 


Les deux droites D et D” sont généralement distinctes. Elles se coupent au 
point moyen du nuage, et leurs coefficients directeurs sont de même signe et 
du signe de r: 


cOv(X, Ÿ) _ S var(Y) " var(Y) _ 1 Jvar(Y) 
var(X) var(X) cov(X, Ÿ) r A var(X) 
De plus, la valeur absolue du coefficient de corrélation  r étant comprise 


entre 0 et 1, la valeur absolue de la pre de la droite D est toujours infé- 
rieure ou égale à celle de la droite 1” (cf. figure 3.6). 


Ces deux droites seront confondues si et seulement si les variables X et Y 
sont liées par une relation linéaire : 


r=l/r = r=#] 


O<r<+1 


Figure 3.6 — Positions respectives des droites des moindres carrés selon les valeurs de r 
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E. Le coefficient r et la qualité de l'ajustement linéaire 


Comment juger la qualité de l’ajustement linéaire ? II est clair que si le coefficient 
r est voisin de 0, il faut rejeter l’ajustement linéaire, mais pour quelles valeurs de 
r, le considère-t-on de bonne qualité ? C’est une question importante, et beaucoup 
d’exemples montrent qu’on ne peut pas établir de règles de décision à partir du 
seul examen de la valeur de r. Moyennant certaines hypothèses dont il ne faut 
pas oublier d'examiner la validité, la formalisation du modèle linéaire (qui 
dépasse le cadre de ce livre) répond partiellement à la question. 


Un résumé numérique est insuffisant pour rendre compte de la pertinence 
d’une liaison linéaire. Pour s’en convaincre, on se reportera aux résultats de 
F. J. Anscombe (cf. figure 3.7) : pour quatre séries de 11 observations simul- 
tanées de deux variables X et Y, on obtient la même valeur du coefficient de 
corrélation linéaire { r = 0,82} et la même droite des moindres carrés 
{y =3+0,5x}, mais l'examen graphique montre que l’ajustement linéaire 
n’est adapté qu’au premier cas. 


I Il I IV 
X Y X Y X Y X Ÿ 
10,0 8.04 10,0 9,14 10,0 7,46 8,0 6,58 
8,0 6,95 8,0 8,14 8,0 6,77 8,0 5,76 
13,0 7,58 13,0 8,74 13,0 12,74 8.0 7,71 
9,0 8,81 9,0 8,77 9,0 7,11 8,0 8,84 
11,0 8,33 11,0 9,26 11,0 7,81 8.0 8,47 
14,0 9,96 14,0 8,10 14,0 8,84 8,0 7,04 
6,0 7,24 6,0 6,13 6,0 6,08 8,0 5,25 
4,0 4,26 4,0 3,10 4,0 5,39 8,0 12,50 
12,0 10,84 12,0 9,13 12,0 8,15 19,0 5,56 
7,0 4,82 7,0 7,26 7,0 6,42 8,0 1,91 
5,0 5,68 5,0 4,74 5,0 3,13 8,0 6,89 


Figure 3.7 — Extrait de F. J. Anscombe : Graphs in Statistical Analysis, 
adapté avec la permission de The American Statistician, 27 (February 1973), 17-21, 
American Statistician Association 


L’ajustement linéaire de la série de la composition minérale en fluorures 
et sodium (mg/l) de 21 eaux minérales gazeuses ( cf. tableau 3.5) ne peut que 
renforcer l’idée de la nécessité d’une étude graphique. 
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Tableau 3.5 — Données extraites du journal Que Choisir ?, n° 422 bis, 2005 


Eau minérale Fluorures Sodium 
Arcens 1,3 439 
Arvie 0,9 650 
Badoit 1 150 
Beckerich 0,6 34 
Châteauneuf 3 651 
Eau de Perrier 0,05 11:5 
Faustine 2 230 
La Salvetat 0,25 7 
Perrier 0,05 11,5 
Puits St-Georges 0,5 434. 
Pyrénées 0,05 31 
Quézac 2,1 255 
San Pellegrino 0,6 35 
St-Diéry 0,3 385 
St-Jean 11 228 
St-Pierre 157 383 
St-Yorre 9 1 708 
Vernet 1:35 120 
Vernière 0,05 154 
Vichy-Célestins 5 1172 
Wattwiller 1,6 3 
Moyenne 1,55 338 
Écart-type 2,03 417 


Le coefficient de corrélation linéaire entre les deux composants minéraux 
est égal à 0,90. Cette valeur assez proche de 1 peut conduire à considérer que 
la droite des moindres carrés ( cf. figure 3.8) permet d’évaluer approximati- 
vement la teneur Ÿ en sodium en fonction de la teneur X en fluorures : 


Y=185X+51 puisque r*=185 et ÿ-1857=51 


Sx 


Mais la représentation graphique du nuage des 21 points ( cf. figure 3.8) 
montre deux points caractérisés par une minéralité particulièrement élevée 
« Vichy-Célestins » et « Saint-Yorre ». 


La représentation des boîtes de distribution des deux variables «  Fluorures » 
et « Sodium » (cf. figure 3.9) confirme que ces deux eaux minérales ont respec- 
tivement des valeurs « éloignée » et « extrême » pour les deux composants 
minéraux (chapitre 1, $ IV). 
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Sodium 
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Fluorures 
Figure 3.8 - Nuage des 21 eaux minérales gazeuses et droite des moindres carrés 


10 2 000 
St-Yorre 
LÀ 
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Figure 3.9 — Boîtes de distribution des deux composants « Fluorures » et « Sodium » 
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En supprimant ces deux points et en réalisant l’ajustement sur les 
19 autres points, on obtient : 


r=0,50 à=129 et b = 9% 
Le coefficient r est passé de 0,9 à 0,5, et il faut aussi remarquer que les 
coefficients de la droite des moindres carrés sont passés respectivement de 
185 à 129 et de 51 à 96.87 


Quel crédit apporter à un ajustement pour lequel deux points ont une telle 
influence ? On est donc obligé d’abandonner l’idée d’une relation linéaire 
entre les deux composants minéraux. 


Cet exemple nous montre que le calcul du coefficient de corrélation 
linéaire doit toujours être complété par un examen graphique. 


L'analyse exploratoire des données propose d’autres méthodes et d’autres 
coefficients pour l’ajustement linéaire. Voici un exemple de coefficient pro- 
posé pour la mesure de la qualité de l’ajustement et pouvant être considéré 
comme un équivalent du carré du coefficient de corrélation linéaire qui, 
rappelons-le, peut être ainsi défini : 


Le deuxième terme de cette égalité peut être interprété comme le rapport 
de la variance des écarts (y;— ÿ;), puisque ceux-ci sont de moyenne nulle, à 
la variance des y;. L'analyse exploratoire des données propose de mesurer 


les dispersions de ces quantités par leur étendue interquartile , d’où le 
coefficient : 
EIQ(y;) 


Si les points du nuage sont alignés, ce coefficient est égal à 1, et plus la 
dispersion des écarts à la droite sera faible (c’est le cas lorsque l’ajustement 
linéaire du nuage est adapté), plus il sera proche de 1. Pour l’ajustement des 
données « Eaux minérales gazeuses » réalisé par la méthode des moindres 
carrés, ce coefficient est égal à : 1 -221/400 = 0,45 


Au cas où l’examen graphique n’aurait pas été fait, cette valeur très dif- 
férente de 1 doit amener à remettre en cause l’ajustement linéaire. 


Tous ces résultats montrent qu’il ne faut jamais conclure sur la dépen- 
dance entre deux variables quantitatives au seul examen de la valeur du coef- 
ficient de corrélation linéaire. 
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D'autre part, lorsqu'une liaison linéaire entre deux variables a été mise en 
évidence par l’étude d’une série de n observations sur ce couple, il faut bien 
se garder de conclure à une relation de cause à effet entre ces variables sans 
en avoir examiné attentivement la signification : une corrélation voisine de 1 
entre la taille (en cm) et la note à un contrôle de mathématiques pour un 
groupe de 12 élèves ne doit pas amener à conclure que plus on est grand, 
mieux on réussit en mathématiques |! 


L'examen graphique, ainsi que celui de la signification des variables, sont 
des compléments indispensables à l’information donnée par la valeur du 
coefficient de corrélation linéaire. 


Dans le cas d’observations non connues individuellement et dont la dis- 
tribution est donnée dans un fableau de contingence, le coefficient de corré- 
lation linéaire et les droites des moindres carrés sont calculés à partir des 
formules pondérées. Cependant, si le groupement de données quantitatives 
en classes a l’avantage de permettre de présenter la distribution sous une 
forme synthétique et de pouvoir en déduire des profils en ligne ou en 
colonne, il constitue une perte d’information qu’il est préférable d’éviter de 
répercuter sur les calculs du coefficient de corrélation linéaire et des coeffi- 
cients des droites des moindres carrés. 


Nous avons exposé la méthode des moindres carrés pour l’ajustement 
d’un nuage de points par une droite qui est la fonction analytique la plus sim- 
ple, mais cette méthode peut se généraliser à un ajustement par d’autres fonc- 
tions analytiques. Les logiciels proposent des ajustements par un polynôme 
du second degré, une fonction exponentielle... C’est l’examen graphique qui 
donne une indication sur le type de fonction à adopter. On peut aussi dans 
certains cas transformer une des deux variables ou les deux variables avant 
d’envisager une relation linéaire. 


IL. Une variable qualitative 
et une variable quantitative 


Soient nr observations portant simultanément sur une variable qualitative X à 
k modalités {x,,...,x;,...,x,} et sur une variable quantitative Y à / modalités 


L 
{V1 Vis M}. 
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A. Mesure de la liaison par le rapport de corrélation 


1) Définition du rapport de corrélation 


Pour les n;(i= 1, ,k) observations de chaque modalité x; de la variable X, 
on calcule la moyenne conditionnelle y; et la somme des carrés des écarts à 
la moyenne ( cf. tableau 3.6). On supposera tous les effectifs n; (ou les fré- 
quences f; = n;/n) non nuls, cette hypothèse impliquant la suppression des 
modalités pour lesquelles on ne dispose pas d’observations. 


Tableau 3.6 — Caractéristiques de Y conditionnellement à X 
pour les données des tableaux 2 et 3 


_ L x? 
Modalité de X n; Y; Ln0y-») 
j=1 
Filière A 37 5,16 496,91 
Filière B 25 6,44 368,25 
Filière C 16 12,31 293,44 
Filière D 23 6.68 340,78 


£ 
La moyenne y; étant la moyenne de Y pour X=x;,ona y = pi fi y: 
($L.C), et pour notre exemple, y = 6,96 i=1l 


On définit la Somme des Carrés Intraclasse , la Somme des Carrés Inter- 
classe et la Somme des Carrés Totale : 


k 1 k 

S Cintra = > DL Ji)? SC = DE >) 

i=lj=l i=1 
k 1 = 
SCiot = PR y) 
i=lj=l 

On montre que : SC = SCintra + SCinter 
Le rapport de corrélation n; x de Yen x est ainsi défini : 
2 _ S Cinter 


Nyyx = OC 


2) Interprétation du rapport de corrélation 


Ce rapport est toujours positif et inférieur ou égal à 1.Ilest  égalà O0 sila 
somme des carrés interclasse est nulle, c’est-à-dire siles moyennes condition- 
nelles y; sont toutes égales à y, mais cette condition n’est pas suffisante à 
l’indépendance des variables X et Y. 
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Si une variable quantitative Y est indépendante d’une variable qualitative X, 
alors leur rapport de corrélation est nul, mais la réciproque n’est pas vraie : 


X et Y indépendantes & le 


Le rapport de corrélation est égal à 1 si la somme des carrés intraclasse 
est nulle, donc si à chaque modalité x; de X, correspond une seule valeur de 
Y égale à y; 

Dans ce cas, la variable Y est liée fonctionnellement à la variable X. 


1, do à chaque x;, correspond une seule valeur de Y 


< } liée fonctionnellement à X 


Pour les données du tableau 3.6 : 
SCinter = SCtot — SCintra = 2 086 — 1 499,38 = 586,62 — es = 0,28 
L’examen du tableau 3.3 des profils en ligne montre la dépendance entre 
la filière d’origine et la note, résultat en accord avec la valeur 0,28 


Considérons maintenant une variable qualitative X à 3 modalités et une 
variable quantitative Y (discrète ou continue) rapportée à 2 valeurs ( cf. 
tableau 3.7). Les observations portent sur 7 individus : n,, +7» +n3,=n: 


Tableau 3.7 -Tableau de contingence avec calculs des moyennes conditionnelles de Y 


Y - 

x Yi Y2 Yi 
X] ni] 0 Ji 

X 0 A2 Y2 

X A3] 0 Yi 


Pour ces données : 
(ITE=X + Fey piwiel23) = Nns;=1 


et ce résultat ne dépend pas des valeurs de y,, »2, n11, 3 et n3,. Quelles que 
soient ces valeurs, la variable Y est liée fonctionnellement à la variable X. 


Supposons maintenant que X soit une variable quantitative rapportée à 
3 valeurs ainsi définies : 


X] = 1 X) = 4 X3 = 6 
et que les effectifs soient les suivants ( cf. tableau 3.8) : 
n, = 20 N)2 = 50 n31 = 30 
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Tableau 3.8 -Valeurs particulières pour les effectifs du tableau 3.7 


Y _ 
x J1 y2 y; 
1 20 0 Yi 
4 0 50 2 
6 30 0 y 
x; 4 4 


La variable X étant quantitative, on peut aussi calculer le rapport de cor- 
rélation de X en y. Les moyennes conditionnelles de X étant égales, la somme 
des carrés interclasse est nulle et le rapport de corrélation n?,, est nul. 

Il y a donc absence de corrélation entre la variable X et toute fonction de 
Y. Cet exemple montre qu’on peut avoir à la fois Y lié fonctionnellement à X 
et absence de corrélation entre X et toute fonction de y. 

On remarquera que le rapport de corrélation n?,, de cet exemple est nul 
quelles que soient les valeurs n;;1, 722, n31 et x1, x, x, telles que les moyennes 
x, et x, soient égales, c’est-à-dire si : 

RuiXi + RuX3 _ 
LES 


B. Comparaison du coefficient de corrélation linéaire 
et des rapports de corrélation 


Si la variable X est une variable quantitative à k modalités, on peut repré- 
senter graphiquement les moyennes conditionnelles y; en fonction des moda- 
lités de la variable X. On obtient k points qu’on peut joindre, dans l’ordre, 
par des segments de droite. On appelle la ligne brisée obtenue « courbe de 
régression de Y en x » (cf. figure 3.10). 


Figure 3.10 — Courbe de régression de Y en x 
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Dans ce cas où X et } sont toutes les deux des variables quantitatives, on 
peut calculer le rapport de corrélation n?,, de X en y (généralement non égal 
à fe 7x) et tracer la « courbe de régression de X en y ». 


Disposant de n observations portant simultanément sur deux variables 
quantitatives, on peut aussi calculer leur coefficient de corrélation linéaire et 
on montre qu’on a toujours la relation suivante entre les rapports de corréla- 
tion et le coefficient de corrélation linéaire : 


SL 2 .n2 
DE Sms) max...) S1 


Si l’un des rapports de corrélation est nul, alors le coefficient de corréla- 
tion linéaire l’est aussi. Le lecteur peut vérifier que c’est le cas pour l’exem- 
ple du tableau 3.8, et il peut constater un nouvel exemple de deux variables 
non indépendantes avec un coefficient de corrélation linéaire nul. 


*Sin’,, = 0, toutes les moyennes conditionnelles de Y sont égales et la 
courbe de régression de  YŸ en x est une droite parallèle à l’axe des 
abscisses ; et réciproquement, si n%,, = 0, les moyennes conditionnelles 
de X sont égales et la courbe de régression de X en y est une droite paral- 
lèle à l’axe des ordonnées. 


Sir? = n?,,, alors les moyennes conditionnelles y; sont liées aux moda- 
lités x; par une relation linéaire, et la courbe de régression de Y en x est une 
droite qui n’est autre que la droite des moindres carrés D de Y en x: 
D =. 02 no 
FF =Ny © y, = a+bx; 


et symétriquement, si r? = 7 . > alors la courbe de régression de X en y 
n’est autre que la droite des moindres carrés D’ de X en y. 


IV. Deux variables qualitatives 


Les données relatives aux observations portant simultanément sur deux 
variables qualitatives X et Y sont généralement présentées dans un tableau de 
contingence (cf. tableau 3.1), ou dans un tableau de profils en ligne ou en 
colonne (cf. tableaux 3.3 et 3.4). 


À condition de disposer des effectifs marginaux , on peut retrouver le 
tableau de contingence à partir d’un tableau de profils en ligne ou en colonne. 


La question qui se pose est celle de l’existence d’une liaison entre les 
deux caractères X et Y. On a vu que s’ils sont statistiquement indépendants 
dans l’ensemble des n individus considérés ($ I.D) : 


nn 
= ff D hi = _ 


À 
pour tous les couples (i, j) tels que i=1,...,ketj=1,..., 1 
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Dans le cas où les observations ne portent pas sur la population totale, 
mais sur une partie de la population appelée échantillon, on ne peut pas con- 
clure à l’indépendance de X et Y par le seul examen des relations d’indépen- 
dance, leur non-vérification sur un échantillon pouvant être due au fait que 
les observations ne sont pas exhaustives ; autrement dit, il faut tenir compte 
des fluctuations d’échantillonnage. 

La comparaison des effectifs fhéoriques (ou « attendus ») sous l’hypo- 
Fe n° nN.; | : 
thèse d’indépendance | n;;, = = | et des effectifs observés n;;, donne une 

n 
idée de la dépendance entre X et Y. Mais pour être plus précis, 1l convient de 
calculer l’écart entre ces effectifs théoriques et observés. 


Pour des raisons théoriques, la mesure usuellement adoptée est celle du 
x2 (khi-deux) qui peut être considérée comme un coefficient d'association 
entre deux variables : 


* * * 
n..-n..)2 =: V2 ñn.. 
a = ÿ Eu) = ny hi} avec : Ji = fi -f. =. _H 

1j is Ji # 


Le y? est nul lorsque les effectifs théoriques et observés  coïncident, et 
plus les effectifs théoriques et observés diffèrent, plus sa valeur est élevée. 
Une autre mesure de la dépendance est le coefficient d'association ®? 


2 
(phi-deux) de Pearson égal à XL, Ce coefficient ne dépend donc pas de la 
n 


taille 7 de la population : 


æ? = y Gi nu 


Les valeurs de ces mesures d’ association entre deux variables peuvent 
permettre de comparer plusieurs groupes d’observations sur un même couple 
de variables. 


Reprenons les données du tableau 3.8 en considérant maintenant les varia- 
bles X et Y comme des variables qualitatives et calculons les effectifs théori- 
ques (ceux-ci sont écrits entre parenthèses dans le tableau 3.9) : 
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Tableau 3.9 — Calcul des effectifs théoriques du tableau 3.8 


Y A Y2 Nje 
X 

x 20 0 20 

(10) (10) 
% 0 50 50 

(25) (25) 
xs 30 0 30 

(15) (15) 
n 50 50 100 


Les valeurs des mesures d’association #2 et ®2 sont les suivantes : 


.—n;)2 à fi V2 
= DOM Lin à = Le SX. ; 
ï, j Ni n ï Jÿ 


V. Bilan 


La mesure de l’association de deux variables dépend de leur nature. Lorsque 
les observations de deux variables quantitatives sont suffisamment nombreu- 
ses pour être présentées dans un tableau de contingence, on peut traiter l’une 
d’elles comme une variable qualitative ou même les deux variables comme 
des variables qualitatives. Leur association peut se mesurer par le coefficient 
de corrélation linéaire, les rapports de corrélation et le khi-deux. 


Pour les données du tableau 3.8, les deux variables X et Y ne sont pas 
indépendantes, mais : 


* elles sont linéairement indépendantes puisque r = 0 
*ilya absence de corrélation entre X et toute fonction de 
D 
Nxyy E 0 
+ la variable Y est liée fonctionnellement à la variable X puisque n° x = I 


Y puisque 


L'analyse conjointe de deux variables est un problème très délicat ; il faut 
bien examiner les données avant de conclure à l’indépendance, et en cas de 
liaison, il convient de ne pas conclure hâtivement à une relation de cause à 
effet sans s’être penché sur sa signification concrète. 
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Testez-Vous (es réponses sont données page 284) 


Il y a au moins une réponse exacte par question. 


1. Le coefficient de corrélation linéaire entre deux variables statistiques : 
a) ne peut être calculé que si les deux variables sont quantitatives 

b) est un nombre positif ou nul 

c) est égal à O si les variables sont indépendantes 


d) est un nombre sans dimension 


2. Deux variables statistiques X et Y sont liées par la relation X + Y = 2, alors : 
a) la somme de leur moyenne est égale à 2 

b) les écarts-types des deux variables sont égaux 

c) les deux droites des moindres carrés sont confondues 


d) les deux droites des moindres carrés ont une pente positive 


3. On dispose de deux observations {(2, 3) et (— 3, 1)} sur un couple ( X, Ÿ) de 
variables quantitatives : 


a) les deux droites des moindres carrés sont confondues 
b) le coefficient de corrélation linéaire entre X et Y est égal à + 1 
c) la pente de la droite des moindres carrés de Y en x est négative 


d) on peut calculer le rapport de corrélation de X en y 


4. On dispose pour 10 années du nombre X d’abonnés au téléphone et du nom- 
bre Y de boîtes d’antalgiques (médicament contre la douleur) vendues dans 
une ville moyenne ; le coefficient de corrélation linéaire calculé à partir de ces 
10 couples d’observations est égal à 0,996 : 


a) les deux variables X et Y sont liées par une relation linéaire 


b) pour diminuer la consommation d’antalgiques, il suffit de refuser des abonnements 
téléphoniques 


c) les deux droites des moindres carrés sont quasi-confondues 


d) les droites des moindres carrés ont des pentes négatives 


5. Sur une population, on a observé une variable quantitative X et une variable 
qualitative Y à trois modalités. La distribution est la suivante : 
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a) ce tableau est un tableau de contingence 

b) la variable X a une moyenne égale à 0,5 

c) on peut mesurer la liaison entre X et Ÿ par un rapport de corrélation 

d) si les profils en colonne étaient tous identiques, alors X et Y seraient indépendantes 


6. Le tableau suivant donne la distribution de deux variables statistiques X et Y : 


Y 
X 


0 20 20 0 
1 10 40 10 


a) la moyenne conditionnelle x; est égale à 1/3 


b) les moyennes conditionnelles de X s’obtiennent à partir du tableau des profils en 
colonnes 


c) la moyenne X est égale à la somme des moyennes conditionnelles x; 


d) les moyennes conditionnelles de Y s’obtiennent à partir du tableau des profils en 
lignes 


7. Le tableau suivant donne la distribution conjointe de deux variables 
quantitatives X et Y : 


Y 
x 0 1 
1 a 10 
1 10 b 


a) si a = 20 et b = 5, alors le coefficient de corrélation linéaire r est nul 
b)sia=0etb=0, alors r=-1 
c) si a =0 et b= 10, alors r=-1 
d) si a = 10 et b = 10, alors r =0 


8. Pour définir un tableau de contingence d’effectif total n à k lignes et 
l colonnes : 


a) il suffit de connaître les effectifs marginaux 

b) il suffit de connaître k - (1 1) éléments du tableau 

c) il suffit de connaître k : (1 — 1) éléments du tableau et les sommes en lignes 
d) il suffit de connaître ( k — 1) + (2— 1) éléments du tableau et ses marges 
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9. Parmi un groupe de 100 malades qui se plaignent de ne pas bien dormir, cer- 
tains ont pris un somnifère sous forme de cachet, d’autres ont pris un cachet 
de sucre ; tous pensaient prendre un somnifère. Après la nuit, on leur a 
demandé si le cachet avait été efficace. Le tableau suivant donne la réparti- 
tion des réponses (on suppose que tous les malades ont dit la vérité) 


Ont bien dormi N'ont pas bien dormi 
Somnifère 26 6 
Sucre 48 20 


a) ce tableau est un tableau de contingence 

b) parmi les malades qui ont pris un somnifère, 26 % ont bien dormi 
c) pour calculer le 72, il faut calculer les effectifs marginaux 

d) le y2 est égal à 1,284 


10. Ce tableau donne la répartition des salariés et non-salariés par sexe pour les 
actifs de 15 ans ou plus ayant un emploi et vivant en France métropolitaine: 


Hommes Femmes 

Non-salariés 13,4 7,3 
Salariés 86,6 92,7 
Intérimaires 2,8 1,4 
Apprentis 1,7 0,9 
Contrats à durée déterminée 6,0 10,8 
Contrats à durée indéterminée 76,1 79,6 

100,0 100,0 

Total des emplois (milliers) 13 670 12 243 


Source : INSEE, enquêtes Emploi du 1°' au 4° trimestre 2008. 
a) les femmes plus souvent salariées que les hommes 
b) la répartition entre les statuts « salariés » et « non-salariés » est indépendante du sexe 
c) pour l’ensemble des hommes et des femmes, il y a 20,7 % de non-salariés 


d) pour l’ensemble des hommes et des femmes, il y a 89,5 % de salariés 
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Exercices (corrigés page 300) 


Exercice 3.1 


Une étude menée par un groupe de compagnies d’assurances auprès de 30 000 assu- 
rés pour le risque « véhicules à moteur » a permis de déterminer les proportions (en 
pourcentage) d’assurés correspondant à la puissance fiscale , notée X, du véhicule 
assuré et au kilométrage parcouru au cours de la dernière année, noté Y. Les résultats 
sont reportés dans le tableau suivant : 


Y (milliers de km) 
. . . > 
Été <10 [10;,20[ [20;30[ [30 ; 40! > 40 
fiscaux) 
<4 4,4 1,6 
5-6 7:2 8,2 4,0 2,6 
7-8 2,4 7,2 13,6 14,4 4,4 
9-10 2,4 11,6 6,0 
> 10 4,4 5,6 


1. Précisez la population étudiée, les caractères étudiés et leur nature. 


2. Donnez la distribution du kilométrage parcouru. Comment s’appelle cette 
distribution ? Calculez sa moyenne et son écart-type en supposant que tous les 
assurés ont fait au moins 2 000 km et au plus 50 000 km. Déterminez la médiane. 


3. Donnez la distribution, en pourcentage, du kilométrage parcouru par les posses- 
seurs d’une voiture d’une puissance fiscale d’au plus 6 CV. Quel est le type de 
cette distribution ? 


Calculez sa moyenne et son écart-type. 


Exercice 3.2 


Dans une entreprise, on étudie la répartition de 100 salariées femmes ( cf. tableau 1) 
et 140 salariés hommes ( cf. tableau 2) selon le salaire mensuel brut  X exprimé en 
euros et l'ancienneté Ÿ exprimée en années. 


Tableau 1 — Salariées femmes 


x É [O ; 4f [4 ; 8[ [8:12[ | [12:20[ | [20:28] 
[1 200 ; 1 800[ 12 10 10 8 
[1 800 ; 2 200[ 8 14 5 4 4 
[2 200 ; 3 000! 6 5 6 3 
[3 000 ; 4 200] 2 3 
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Tableau 2 — Salariés hommes 


x [O ; 4f [4 ; 8[ [8:127 | [12:,20[ | [20 ;28] 
[1 200 ; 1 800[ 10 6 
[1 800 ; 2 200[ 4 9 18 8 8 
[2 200 ; 3 000[ 4 8 16 12 4 
[3 000 ; 4 200] 5 8 8 12 


1. Définissez la population étudiée, l’unité statistique, les caractères étudiés et leur 
nature. 


2. Quel pourcentage de femmes gagnent moins de 2 200 € parmi les femmes qui ont 
moins de 8 ans d’ancienneté ? 


3. Calculez la moyenne et l’écart-type du salaire des femmes, ainsi que la moyenne 
et l’écart-type du salaire des hommes. En déduire le salaire moyen de l’ensemble 
des 240 salariés. 


4. Calculez la moyenne et l’écart-type de l’ancienneté des femmes. 


5. Représentez le graphe des fréquences cumulées de la distribution marginale de 
l’ancienneté des femmes. 


6. Calculez la distribution (en pourcentage) de l’ancienneté des femmes gagnant au 
moins 1 800 €. 


7. On considère la distribution conjointe du salaire et de l’ancienneté des cent sala- 
riés femmes. Sachant que le coefficient de corrélation entre X et Y est égal à 
0,45 pour cette distribution, donnez l’équation de la droite des moindres carrés de 
Y en X. Quel est le point d’intersection de cette droite avec l’autre droite des moin- 
dres carrés de X en Y ? 


Exercice 3.3 


Le tableau suivant donne les pourcentages de variation par rapport à la période pré- 
cédente du produit intérieur brut (prix constants) et de la consommation finale privée 
(prix constants) en France ( source : http://stats.oecd.org/) 


Année 1990 | 1991 1992 | 1993 1994 | 1995 | 1996 | 1997 | 1998 | 1999 
PIB 2,6 10 1,4 — 0,9 2,2 2,1 1,1 2,2 3,5 3,3 
Consommation 2,5 0,6 1,0 — 0,4 1,4 1,7 1,6 0,4 3,9 3,5 

Année 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 | 2007 | 2008 | 2009 

PIB 3,9 1,9 1,0 1,1 2,5 1,9 2,2 2,3 0,4 —2,2 
Consommation 3,6 2,6 2,4 2,0 2,5 2,6 2,4 2;5 1,0 0,8 


1. Calculez les séries des indices, base 1989, du PIB et de la Consommation privée. 


— Calculez le coefficient de corrélation linéaire entre les indices du PIB et de 
la consommation privée. 
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2. Peut-on considérer qu'il y a approximativement une liaison linéaire entre les indi- 
ces de volume du PIB et de la Consommation privée ? Calculez l’équation de la 
droite des moindres carrés expliquant l’indice de la Consommation privée en fonc- 
tion de l’indice du PIB. 


Représentez le nuage des 21 points avec la droite des moindres carrés. 
Quelle est la part de variation de l'indice de la consommation privée expliquée par la 


relation linéaire ? 


3. Calculez le coefficient de corrélation linéaire entre les variations du PIB et de la 
Consommation privée. Calculez l’équation de la droite des moindres carrés expli- 
quant la variation de la Consommation privée en fonction de la variation du PIB. 


Représentez le nuage des 20 points avec la droite des moindres carrés. 
4. Vous semble-t-il plus intéressant d'analyser la liaison entre les variations du PIB 


et celles de la Consommation privée qu'entre les indices du PIB et de la Consom- 
mation privée ? Si oui, pourquoi ? 


Exercice 3.4 
Une entreprise a effectué un sondage auprès de sa clientèle pour connaître son appré- 


ciation sur le service livraison. Les résultats ont été les suivants 


Pas du Plutôt 
tout pas 
satisfait | satisfait 


Plutôt Très 
satisfait | satisfait 


Clients de plus de 2 ans d’ancienneté 10 50 245 195 


Clients d’au plus 2 ans d’ancienneté 40 90 205 165 


1. Calculez le pourcentage total de clients plutôt satisfaits ou très satisfaits. 


2. Calculez le pourcentage de clients de plus de 2 ans d’ancienneté parmi les clients 
plutôt satisfaits ou très satisfaits. 


3. Donnez le tableau des profils en ligne. 


4. Donnez le tableau de contingence obtenu en regroupant : 
— d’une part les clients pas du tout satisfaits et plutôt pas satisfaits ; 
— et d’autre part les clients plutôt satisfaits et très satisfaits. 


5. Si les 2 caractères étaient indépendants, combien aurait-on de clients de plus de 
2 ans d’ancienneté dans la catégorie plutôt satisfait ou très satisfait ? 


D'après examen de juin 2001, GEA 1° année Paris IX-Dauphine. 


Exercice 3.5 


L'observation des quantités offertes sur un marché de raisin de table et des prix de 
vente a donné les résultats suivants : 


Quantité X à la vente (tonnes) 100 120 84 78 87 80 110 95 


Prix moyen Y par kg (euros) 1,60 1,40 1,95 2,10 1,75 2,25 1,50 1,80 
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1. Calculez le coefficient de corrélation linéaire entre X et Y. 


2. Déterminez l’équation de la droite des moindres carrés de  Y en X. Sans faire de 
calcul, donnez le signe de la pente de la droite des moindres carrés de X en }. 


3. On admet que la valeur du prix moyen  Y par kg en fonction de la quantité à la 
vente X est déterminée par l’équation trouvée à la question 2. 
La recette globale correspondant à la vente de la totalité du raisin est-elle une fonc- 
tion constamment croissante de x ? 
Sinon, quelle est la valeur critique x, que les producteurs ont intérêt à ne pas 
dépasser ? 


Exercice 3.6 


Le tableau suivant, extrait de la revue Synthèses, « Revenus et patrimoine des 
ménages » (INSEE, n° 19, 1998), donne la répartition (en %) des ménages selon leur 
niveau de vie et leur type socio-économique. 


ne Inférieur Du 1e décile | Du 3 quartile au | Au moins égal 
au 1er décile au 3e quartile 9% décile au 9 décile Ensemble 
se ; <3700 [3 700 ;9 933[ | [9933 ; 13 900 2 13 900 

Type socio-économique 
Communes agricoles 22 13 1 5 12 

18 70 8 4 00 
Communes et quartiers ouvriers 41 41 31 22 37 

Il 71 12 6 00 
Communes et quartiers 28 34 39 32 34 
des classes moyennes tertiaires 8 65 17 9 00 
Communes et quartiers 3 5 Il 13 7 
techniques très qualifiés 5 SI 25 19 00 
Quartiers huppés 6 6 12 28 9 

6 44 20 30 00 
Ensemble 100 100 100 100 100 

10 65 15 10 00 


«uc » : unité de consommation. 
Lecture : 30 % des habitants des « quartiers huppés » appartiennent au 1( décile de niveau de vie (c’est-à-dire parmi les 
10 % des ménages les plus aisés). Et 28 % des ménages du 10 décile habitent dans des quartiers huppés. 

Champ : ménages hors étudiants. 


Source : Enquête Logement 1996, INSEE. 


1. Précisez la population étudiée, l’unité statistique, les caractères et leur nature. 


2. Quels types de distributions avez-vous dans ce tableau ? Écrire les deux tableaux 
de distributions conditionnelles. 


3. Donnez la valeur médiane du niveau de vie en F/uc/mois des ménages appartenant 
aux « Quartiers huppés ». 


4. Proposez un indicateur de disparité des niveaux de vie pour l’ensemble des ména- 
ges. Donnez sa valeur. 


5. Parmi les ménages ayant un niveau de vie supérieur au 3 € quartile (ménages qui 
se situent parmi les 25 % ayant le niveau de vie le plus élevé, soit plus de 
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9 933 F/uc/mois), quel pourcentage habite dans un quartier « huppé » ou dans un 
quartier « technique très qualifié ». 


6. Calculez la distribution (en %) du niveau de vie en F/uc/mois des ménages appar- 
tenant aux « communes et quartiers techniques très qualifiés » ou aux « quartiers 
huppés ». 


Exercice 3.7 


Le tableau suivant donne la distribution de 200 étudiants selon leur note d'examen X 
en Économie et leur note d’examen Y en Statistique. 


k lots a | 17,91 Lio, lu, 1311u3,151/015,1%| 117,19 
[5,7 7 3 2 

[7 ,9[ 2 12 12 ; 

[9,11[ 1 10 18 8 2 

[11,13[ 7 15 21 10 1 

[13,15 11 12 13 5 

[15,17 1 3 10 7 1 
[17 , 19] 1 1 p) 


1. Calculez les rapports de corrélation de Y en x, et de X en y. 
2. Tracez la courbe de régression de Y en x. 


3. Peut-on calculer une autre mesure de la liaison des variables X et Y ? 


Exercice 3.8 


Reprenons les données relatives aux 21 eaux minérales gazeuses (cf. tableau 3.5). On 
recode la variable X (fluorures) en trois classes et la variable  Y (sodium) en quatre 
classes, de la façon suivante : 


C1x [0 ; IT C1; [0 ; 100! 

C2% [1 ; 21 C2y [100 ; 300[ 

C3% (2:91 C3; [300 ; 500[ 
C4y [500 ; 2 000] 


1. Écrire un tableau qui a pour première colonne les eaux minérales, pour deuxième 
colonne la variable XC (variable X recodée) égale au numéro de classe dans le 
recodage de X, et pour troisième colonne la variable YC (variable Y recodée) égale 
au numéro de classe dans le recodage de y. 
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2. Construire le tableau de la distribution conjointe des variables  XC et YC (XC en 
ligne et YC en colonne). Donnez le tableau des profils en ligne associé. 


3. Les variables XC et YC sont-elles indépendantes ? (justifiez votre réponse) 


4. Donnez le tableau de distribution de la variable X€C sachant que Y est supérieur à 
300 mg/l. Comment s’appelle cette distribution ? 


Exercice 3.9 


Soit les données trimestrielles suivantes relatives à des souscriptions de contrats 
d’assurance vie de fin mars 2000 à fin décembre 2002 : 


Y = Nombre 
t de contrats 
souscrits 


117 
178 
149 
189 
145 
173 
170 
223 
223 
281 
285 
339 


Nombre de contrats 


0 1 2 3 4 5 6 7 8 9 10 11 12 t 
Représentation graphique 


= 
= 5 © ©œ  o Un À & D = 


= 
(e) 


Tous les résultats de cet exercice seront donnés avec une précision de deux décimales. 
1. Calculez le taux trimestriel moyen de croissance du nombre de contrats souscrits. 


2. On ajuste cette série par le modèle linéaire : Y=at+ b. 
2.1. Calculez les coefficients de ce modèle par la méthode des moindres carrés. 


2.2. Quelle est la part de variation de Y non expliquée par le modèle ? 


3. On ajuste maintenant cette série par le modèle quadratique : Y = ar + b. 
3.1. Calculez les coefficients de ce modèle par la méthode des moindres carrés. 


3.2. Quelle est la part de variation de Y non expliquée par ce nouveau modèle ? 
4. Quel modèle choisissez-vous ? (justifiez votre réponse) 


D'après examen de juin 2006, DUGEAD 1° année Paris-Dauphine. 
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4, Séries chronologiques 
et prévision 


suite ordonnée d'observations d'une grandeur au cours du 

temps. L'étude de ces séries intéresse tous ceux qui désirent 
décrire, expliquer, contrôler, prévoir des phénomènes évoluant au cours 
du temps. 


U ne série chronologique - où chronique -— est constituée par une 


1. Eléments constitutifs d'une série chronologique 


L'étude d’une série chronologique { x, , {= 1,... , 1} consiste à dissocier les 
différents mouv ements qui la composent et à les analyser . Cette décom- 
position est une construction de l’esprit puisque les séries composantes sont 
des concepts abstraits et ne peuv ent pas être directement observées. Une 
représentation graphique s’impose en début d’analyse de toute chronique afin 
de faire apparaître les éléments fondamentaux. 

Les intervalles entre deux observations successives sont supposés de 
même longueur. Dans la pratique, cette hypothèse est rarement réalisée. 
Pour des séries mensuelles de productions, de ventes.., le nombre de jours 
ouvrables de chaque mois varie : le nombre de dimanches dans le mois, les 
jours de certaines fêtes mobiles ne sont pas les mêmes chaque année. Pour 
que ces variations ne soient pas intégrées dans la composante résiduelle du 
modèle, on corrige les données en adoptant une correction proportionnelle 
qui consiste pour des données mensuelles, par exemple, à ramener chaque 
mois à un même nombre théorique de jours. 


A. L: tendance à long terme 


La tendance à long terme ou trend, notée f,, est le f acteur représentant 
l’évolution à long terme de la grandeur, et traduit l’aspect général de la série : 
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croissance de la consommation d’électricité, croissance du trafic aérien, 
diminution de la population rurale, par exemple. 

Pour de longues séries, un mouvement cyclique peut se superposer à la 
tendance. La composante cyclique liée à la succession des phases du cycle 
économique (prospérité, dépression, reprise), a donné lieu jusqu’au milieu du 
xX® siècle à de multiples travaux, mais n’est plus actuellement l’objet d’un 
intérêt aussi marqué. 


B. Le mouvement saisonnier 


Le facteur saisonnier, noté s,, se répète à intervalles de temps égaux avec une 
forme à peu près constante. Il peut être dû au rythme des saisons ou à des 
facteurs humains. Sa période est de 12 pour des séries mensuelles, de 4 pour 
des séries trimestrielles. 

Si p désigne la période du mouvement saisonnier : s,=5,,,= 58,2, = 


Le facteur saisonnier est donc totalement déterminé par  p coefficients 
saisonniers : 


Sfiyses AE 


C. Les irrégularités 


Cette composante, appelée aussi mouvement résiduel et notée e,, regroupe 
tout ce qui n’a pas été pris en compte par la tendance et le f acteur saisonnier. 
Elle est la résultante de fluctuations irrégulières et imprévisibles dues à des 
facteurs perturbateurs non permanents ; ces fluctuations sont supposées de 
faible amplitude et de moyenne nulle sur un petit nombre d’observ ations 
consécutives. 


D a Les perturbations 


Les perturbations sont des fluctuations ponctuelles de forte amplitude. Elles 
sont dues, pare xemple, à une grèv e, à des conditions météorologiques 
exceptionnelles pour l’agriculture, à un krach financier. Il con vient de les 
éliminer avant tout traitement de la série . Les méthodes pour le f aire sont 
simples ; pour faire comme si ces événements n’a vaient pas eu lieu, les 
instruments pri vilégiés sont  l’interpolation et la règle detr  ois. La 
représentation de la série chronologique des « Voyageurs RATP » de 1995 à 
2002 (cf. figure 4.1) montre une baisse importante du nombre de v oyageurs 
en décembre 1995 due à une longue grèv e. Avant d’estimer les composantes 
de cette chronique, il est nécessaire de corriger la v  aleur 0,19 milliard de 
voyageurs-km de ce mois de décembre en la remplaçant, par e xemple par la 
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moyenne des mois de décembre 1994 et 1996 (resp. 1,06 et 0,95 milliards de 
voyageurs-km), soit 1 milliard de voyageurs-km. 

On traite généralement des séries à deux composantes : tendance et mou- 
vement résiduel, ou à trois composantes : tendance, mouvement saisonnier 
et mouvement résiduel. Les observations d’une chronique possédant une 
composante saisonnière peuvent être disposées dans un tableau selon les 
deux dimensions du temps, annuelle et mensuelle (ou trimestrielle), comme 
pour les tableaux 4.1, 4.2 et 4.4. Cette présentation, introduite par C. Buys- 
Ballot en 1847, est appelée « table de Buys-Ballot ». 


Il. Les modèles de composition d'une série 


chronologique 
La décomposition d’une série chronologique possédant un mouv ement 
saisonnier peut s’effectuer selon trois types de modèles : 
* modèle additif x =f,+s,+e, = l;5335T 
* modèle multiplicatif x =f,. (1+5s):(1+e, t=1,.,T 
* modèle mixte x =f, (1+s)+e, = 1; T 


On choisit un modèle multiplicatif ou mixte si le mouvement saisonnier 
présente des amplitudes proportionnelles à la tendance. 


Notons qu’une transformation logarithmique du modèle multiplicatif 
ramène au modèle additif : 


log(x) = log f,-(1+5)-(1+e))= log(f) +log(1 +5) +e, 

puisque log(1+e,)=e, 

Nous n’envisagerons de méthodes de décomposition que pour les modèles 
additif et multiplicatif. 


Pour le mouvement saisonnier de période  p, on fait l'hypothèse d’une 
compensation exacte sur une période entre les variations saisonnières positi- 
ves et les variations saisonnières négatives, sinon, le partage entre le facteur 
saisonnier et la tendance serait indéterminé : 


P 
D 5; = 0 
j=1 


Quand on analyse une série chronologique, le premier problème est le 
suivant : la série présente-t-elle des variations saisonnières et si oui, quel est 
le schéma de composition le mieux adapté ? 


SÉRIES CHRONOLOGIQUES ET PRÉVISION e 105 


On commence par représenter la série graphiquement. Si la série présente des 
variations saisonnières, les points hauts (maxima) ainsi que les points bas 
(minima), sont toujours distants du même nombre de dates, ce nombre étant la 
période du mouvement saisonnier. La chronique représentée à la figure 4.1 a une 
composante saisonnière de période 12 (série mensuelle), et la chronique représen- 
tée la figure 4.2 a une composante saisonnière de période 4 (série trimestrielle). 


Tableau 4.1 - Voyageurs RATP (milliards de voyageurs/km) 


AMée | 1095! 1996] 1997| 19981 1990 | 2000 | 2001 | 2002| 2003 | 2004 | Moyenne 
Mois mensuelle 
Janvier | 1.04 | 0,91 | 0,98 | 1.01 | 1,05 | 1.09 | 1,14 | 1,18 | 1.22 | 1.21 | 1.08 
Février | 0,93 | 0,95 | 0,89 | 0,91 | 0,98 | 0,99 | 1,00 | 1,09 | 1.06 | 1,12 | 0,99 
Mars 1,06 | 0,94 | 1,02 | 1,07 | 1,13 | 1,17 | 1,19 | 1,23 | 1.24 | 1,31 | 1,14 
Avril 0,89 | 0,93 | 0,96 | 0,98 | 1,01 | 1.00 | 1,02 | 1,11 | 1,08 | 115 | 1.01 

Mai 0,98 | 0,92 | 0,94 | 0.94 | 0,99 | 1,12 | 1,10 | 1,12 | 1,01 | 118 | 1.03 
Juin 101 | 0,94 | 0,97 | 101 | 0,99 | 1,03 | 1,12 | 1,16 | 1.04 | 126 | 1.05 
Juillet | 0,79 | 0,85 | 0.86 | 0,88 | 0,90 | 0,99 | 0.99 | 1,08 | 1.01 | 1,07 | 0,94 
Août 0,65 | 0.62 | 0.65 | 0,67 | 0,71 | 0,76 | 0,79 | 0,80 | 0,76 | 0.84 | 0,73 
Septembre | 0.87 | 0,92 | 0,93 | 1.00 | 1,02 | 1.04 | 1,05 | 1.12 | 1,14 | 12 1,03 
Octobre | 0,98 | 1.07 | 1,08 | 1,10 | 1,14 | 1,20 | 1,21 | 1,28 | 1.27 | 1,31 | 1.16 
Novembre | 0.83 | 0,96 | 0,99 | 1.04 | 1,05 | 1,14 | 1,14 | 1.16 | 1.16 | 1.24 | 1.07 
Décembre | 0,19 | 0.95 | 1,00 | 1,08 | 1.07 | 1,14 | 1,09 | 1.18 | 1.23 | 1,28 | 102 


Moyenne 


0,85 | 0,91 | 0,94 | 0,97 | 1,00 | 1,06 | 1,07 | 1,13 | 1,10 | 1,18 1,02 
annuelle 


Source : www.insee.fr 


Tableau 4.2 — Indices de valeur des produits alimentaires (base 2000) 


Année | 1995] 1996| 1997] 1998| 1999] 2000! 2001 | 2002| 2003! 2004 | Moyenne 
Mois mensuelle 
Janvier | 62.2 | 68,4 | 694 | 76,1 | 78,5 | 75,9] 870] 87.8] 903] 960! 792 
Février | 64.7 | 67.2 | 70,7 | 70,3 | 76.3 | 79,1| 82,5] 891] 901! 939! 703 
Mars 81,3 | 77,9 | 78,9 | 92,4 | 99,0 | 997| 987| 999] 1027| 117,5] 94,8 
Avril | 724 | 83,3 | 87,1 | 92,7 | 901 | 88.5] 89.6 | 103.0 | 108,9] 118.2] 934 
Mai 85,3 | 85,0 | 84,6 | 91.8 | 90.8 | 103,8 | 100,7 | 100,0! 103.1] 108.1] 95.3 
Juin 84,5 | 85,8 | 86,3 | 98,3 | 100,5 | 98,6] 102.6 | 103,6 | 116,4! 133,6| 101.0 
Juillet | 89,0 | 90,4 | 95,0 | 99,9 | 102,9 | 95,0! 101,4 | 110,8 125,2| 1309| 104.1 
Août 82,5 | 81,1 | 88.6 | 93,3 | 102.4 | 108,1 | 107,7 | 107.6| 117,6! 125,0| 1014 
Septembre | 89,1 | 86,5 | 98,0 | 102,7 | 110,4 | 113,9 | 105.9 | 112.4 | 121,7] 130,3] 107.1 
Octobre | 85,1 | 92,9 | 101,7 | 96.0 | 104,0 | 105,3 | 111,0] 119,8 | 125,8! 118,4| 106.0 
Novembre | 919 | 90,9 | 96.2 | 106,3 | 118,6 | 119,7 | 122,8 | 126,9 | 127.8! 141,5] 1143 
Décembre | 88,5 | 98,5 | 101.5 | 107,3 | 111.9 | 112,6 | 107,8 | 122,5 | 134.8 1423| 112,8 


Moyenne 


81,4 | 84,0 | 88,2 | 94,7 | 98,8 | 100,0 | 101,5 | 107,0 | 113,7 | 121,3 99,0 
annuelle 


Source : www.insee.fr 
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Voyageurs RATP (milliards de voyageurs-km) 


Lignes brisées reliant les extrema 


Janvier 1996 Janvier 1998 Janvier 2000 Janvier 2002 Janvier 2004 
Figure 4.1 — Représentation graphique de la chronique du tableau 4.1 
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Janvier 1996 Janvier 1998 Janvier 2000 Janvier 2002 Janvier 2004 


Figure 4.2 — Représentation graphique de la chronique du tableau 4.2 


Pour choisir le modèle de composition , on peut relier par une courbe (ou 
plutôt par une ligne brisée) les maxima distants d’une période  p et faire de 
même avec les minima. 


+ Si ces deux courbes sont à peu près parallèles, alors le facteur saisonnier 
a des amplitudes à peu près constantes, c’est-à-dire qu’il affecte la ten- 
dance indépendamment de son niveau, et le schéma additif est adapté. 
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C’est le cas de la chronique des « Voyageurs RATP » de 1995 à 2004 
(cf. figure 4.1). 

° Sinon, on représente la chronique sur un papier à ordonnée logarithmique 
(chapitre 2, $ IV.A). Si les deux courbes reliant les extrema sont à peu près 
parallèles, alors le facteur saisonnier a des amplitudes à peu près proportion- 
nelles à la tendance, c’est-à-dire que les effets des variations saisonnières 
sont proportionnels au niveau atteint par la tendance, et le schéma multipli- 
catif est adapté. C’est le cas de la chronique des « Indices de valeur des 
produits alimentaires » de 1995 à 2004 ( cf. figures 4.2 et 4.3). 


Indices de valeur des produits alimentaires, base 2000 
1 000 


Lignes brisées reliant les extrema 


100 


Janvier 1996 Janvier 1998 Janvier 2000 Janvier 2002 Janvier 2004 


Figure 4.3 — Représentation de la chronique du tableau 4.2 
avec une ordonnée logarithmique 


Le modèle multiplicatif convient dans la plupart des cas puisque d’une 
part, l’effet saisonnier est généralement proportionnel à la tendance, et que 
d’autre part, dans le cas d’une chronique à tendance faiblement croissante ou 
faiblement décroissante, les deux schémas sont quasiment équivalents. C’est la 
raison pour laquelle on n’évoque bien souvent que le modèle multiplicatif. 


L LE Analyse de la tendance 


A. Ajustement de la tendance par une fonction analytique 


Les logiciels spécialisés (SPSS...), mais aussi les tableurs (Excel .) 
proposent des fonctions analytiques pour ajuster la tendance, l’ajustement se 
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faisant par la méthode des moindres carrés (méthode qui minimise les écarts 
quadratiques entre modèle et observations). Citons quelques-uns de ces 
modèles : 
+ modèle linéaire : y(t)=a+b:t 
* modèle quadratique : y(t)=a+b-t+c-t12 
* modèle exponentiel : y(t) = exp (a + b:t), ce type de modèle convient à 
des quantités évoluant à taux constant puisque  y(f + 1) = exp(b) : y(t) 
(S y(t+1)=c: 7y(t) où c est constant) 


* modèle logarithmique : y(t) = a + b : In (ft) 


* modèle S (courbe « sigmoïde ») : y(t) = exp(a + b/f), ce type d’ajuste- 
ment convient à la description du cycle de vie de certains produits. 


Ces méthodes analytiques sont simples, mais reposent sur l'hypothèse 
d’une tendance évoluant selon une fonction analytique déterminée, hypothèse 
qu’on ne peut pas fréquemment faire, même à la suite d’une transformation 
de variable. 


En l'absence de référence à un modèle précis pour la tendance, on préfé- 
rera utiliser une méthode non-paramétrique qui filtre la tendance en éliminant 
le facteur saisonnier tout en réduisant les irrégularités. Dans la suite, nous 
appellerons filtre une sorte de « boîte noire » régularisant une chronique X en 
la transformant en une chronique Y qui est une approximation de la compo- 
sante tendancielle de la chronique X : 


* d 


Nous étudierons deux des principaux filtres linéaires qui sont la moyenne 
mobile et le lissage exponentiel simple. Un filtre linéaire est une application 
linéaire de l’ensemble des chroniques dans lui-même transformant la chroni- 
que X en une nouvelle chronique Y de la façon suivante : 


ÿ; = Doux avec KCZ et DT = | 
keK keK 
Le choix du filtre linéaire approprié à certains objectifs se fait par l’inter- 
médiaire du choix de ses coefficients ©} 


B. Déiinition d'une moyenne mobile 


On appelle moyennes mobiles centrées de longueur p (p < T) de la série 
{x, ,1=1,...,77} les moyennes successives calculées en fonction de la parité 


de p selon les formules qui suivent. 
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+m 
e Premier cas, p impair, p=2m +1: M,(t) = L », Xi 
Py = -m 


I ya(T-p +1) moyennes mobiles centrées de longueur impaire p. 


e Deuxième cas, p pair, p = 2m: 


ml 
_ 1 Xi m Xi m 
M, (1) — 1 2 La > Xirr + 2 | 


k=-m+1l 


La moyenne mobile centrée M,,,(f) apparaît comme la moyenne pondérée 
de valeurs de la série encadrant la date f avec les coefficients de pondération 


; s.. 4 à : : 
égaux à -— pour les deux valeurs extrêmes x,_,, et x,,,, et égaux à — pour 
P P 


les (p — 2) valeurs intermédiaires x,_,,1 à X;4;»_1: 


Elle comporte donc (p + 1) termes : 


Valeurs x Xl À + m1] 1+m 


Pondérations _— 


1 1 
2p P P P 2p 


Il ya(T-p) moyennes mobiles centrées de longueur paire p. 


Pour simplifier, la longueur p de la moyenne mobile étant fixée, on notera 
désormais y, la moyenne mobile centrée de longueur p à la date f. 


C. Détermination de la tendance par la méthode 
des moyennes mobiles 


Si une série X est périodique de période p, c’est-à-dire si la série rede vient 
identique à elle-même tous les  p termes, alors toute suite de mo  yennes 
mobiles de longueur p” (différente de p) a pour période p. 

Démontrons cette propriété dans le cas où  p’est impair ( p’=2m +1). 
Soit y, la moyenne mobile centrée de longueur  p'’à la date f de la série X, 
montrons que la série Y est de période p : 


+m +m 


1 1 
Er nr 


=-m k=-m 


La démonstration de cette propriété est laissée au lecteur pour le cas où p 
est pair, et celui-ci pourra montrer en sus que lorsque la période de la série 


110 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


X est égale à la longueur de la moyenne mobile (p'= p), les moyennes mobi- 
les forment alors une suite de termes constants égaux à la moyenne des ter- 
mes de la série X sur une période. 


La moyenne mobile centrée de longueur  p rend constantes les séries 
périodiques de période p. 

— Deux chroniques ont la même suite de moyennes mobiles centrées de 
longueur p si leur différence est une série périodique de période  p dont la 
somme des termes sur une période est nulle. 


D Exemple 
La chronique {x, , 1= 1,... ,12} du tableau 4.3 est périodique de période 
p = 4 ; les suites des moyennes mobiles de longueur 2, 3, 5 sont aussi 
de période 4, et la suite des moyennes mobiles de période 4 est une suite 
de termes constants égaux à -1/4, moyenne des termes sur une période. 


Tableau 4.3 - Calcul de moyennes mobiles 


A|B C | D | E | F | G | H | [ | J 
t| +: M2 M3 M4t) M5 

= 
3] + nt -1,00 -0,25 0,2 

4 2 -0,75 -0,33 -0,25 -02 

5 2 0,5 0,00 -0,25 -0,4 Ms 

6 0 0,25 0,33 -0,25 -06 

7l__+ ni -1,00 -0,25 02 

8| 2 0,75 -0,33 -0,25 -02 

9 2 0,5 0,00 -0,25 

10 0 0,25 0,33 

dl 1 -1,00 

12] 2 


=SOMME(B5:B7)/3 


=(B5/2+B6+87/2)/2 


Soit C, la courbe joignant les points ( f, x,). Si la concavité de C est 
tournée vers le haut, alors y, est supérieur à x, pour tout f ; dans le cas 
contraire, y, est inférieur à x, pour tout r. Si C est une droite, y, est égal 
à x, pour tout f. 


En conclusion, la moyenne mobile centrée transforme une série alignée 
en elle-même et plus généralement, une série monotone à faible cour- 
bure en une série peu différente. 


La moyenne mobile transforme des écarts dus à des irrégularités — indé- 
pendantes, de moyenne nulle sur un petit nombre de dates successives 
(par hypothèse) et de même variance — en écarts de variance plus faible: 
on dit qu’elle a un effet de « rabot », ou aussi qu’elle « lisse » la chro- 
nique, en ce sens que la série YŸ est moins dispersée que la série initiale 
X. Mais les nouvelles irrégularités qui sont corrélées entre elles, peuvent 
faire apparaître des oscillations parasites qui ne figuraient pas dans la 
série initiale (effet de Slutsky-Yule). 
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— Si la période du mouvement saisonnier est égale à p, alors la 
moyenne mobile centrée de longueur p est un filtre linéaire qui élimine 
le mouvement saisonnier tout en réduisant l’amplitude du mouvement 
résiduel. De plus, on montre que sa valeur y, à la date f peut être assi- 
milée à la tendance f, si celle-ci est à faible courbure — à faible variation 
dans le cas d’un schéma multiplicatif —- sur p dates consécutives. 


D. Inconvénients de la méthode des moyennes mobiles 


Un changement de niveau ou de pente de la tendance à une dater entraîne une 
mauvaise approximation de cette composante pendant toute une période 
précédant et sui vant cette date (figure 4.4). C’est la raison pour laquelle on 
fait l'hypothèse d’une tendance monotone à faible courbure. 
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Figure 4.4 — Représentation d’une chronique et de ses moyennes mobiles centrées de longueur 4 


Si on dispose de T'= np observations (7 = nombre d’années et p = période 
du mouvement saisonnier) et si p est pair, on ne peut calculer que ( T-p) 
moyennes mobiles de longueur p. On ne disposera pas de valeurs pour la 
tendance sur les p/2 dernières dates qui ne pourront pas être prises en compte 
pour une prévision. 


Malgré ces inconvénients, on admettra que dans la plupart des cas, la 
valeur f, de la tendance s’évalue par la moyenne mobile centrée y, de lon- 
gueur égale à la période du mouvement saisonnier. 
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IV. Correction des variations saisonnières 


Si on étudie une chronique a vec variations saisonnières, l’év aluation de la 
tendance à chaque date  f par la mo yenne mobile centrée de longueur 
adéquate, conduit pour chaque coefficient saisonnier à plusieurs valeurs qu’il 
faut résumer. Pour bien comprendre toutes les opérations successi ves pour la 
détermination des coefficients saisonniers et de la série corrigée des 
variations saisonnières, on se reportera à l’exemple traité au paragraphe 5. 


À. Mhète additif 


Le modèle est le suivant: x, =f+5,+e, 
On approxime la tendance f, par la moyenne mobile centrée y.. 


Soient 7 le nombre d’années et p la période du facteur saisonnier : 


T = np observations > np —p = p (n- 1) moyennes mobiles si 
p est pair (cf. tableau 4.5). 


Les coefficients saisonniers étant périodiques de période  p, on dispose 
pour chacun des p coefficients saisonniers de (n — 1) valeurs qui sont (n — 1) 
différences { x, — y,}. On résume ces ( 7 — 1) valeurs par leur moyenne arith- 
métique, ou leur médiane, ou leur moyenne arithmétique après élimination 
de la valeur la plus faible et de la valeur la plus élevée (le logiciel SPSS 
utilise ce dernier résumé). 


Si la somme des coefficients saisonniers n’est pas nulle sur une période, 
on corrige les coefficients saisonniers obtenus de façon à avoir une somme 
nulle : 


_ : 1 
$, >  S, = $,-$ avec $ = — os, 


On appelle série corrigée des variations saisonnières (série CVS) la série 
des différences : 


A = X—S; 

Pour toutes les dates pour lesquelles on dispose de la valeur de la 
moyenne mobile, et donc d’une évaluation de la tendance, on peut calculer 
l’écart entre le modèle et l’observation : 


* * 
GTX Yi Sr = Xs — Y; 
Si le modèle est adapté, les valeurs absolues des écarts ne doivent pas être 
élevées, et leur somme voisine de zéro. 
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B. Modèle multiplicatif 


Le modèle est le suivant : x, = f,- (1+5,)- (1+e,) 


Comme précédemment, on approxime la tendance  f, par la moyenne 
mobile centrée y,. 


Les coefficients saisonniers étant périodiques de période  p, on dispose 
pour chacun des p coefficients saisonniers de (n — 1) valeurs qui sont (n — 1) 
quotients { x, / y,}. On résume ces ( 7 — 1) valeurs par leur moyenne arithmé- 
tique, ou leur médiane, ou leur moyenne arithmétique après élimination de la 
valeur la plus faible et de la valeur la plus élevée (le logiciel SPSS utilise ce 
dernier résumé). 


Si la somme des (1 + s,) n’est pas égale à p sur une période, on fait une 
correction proportionnelle : 


s = 
1+5, — 1+5, = + avec s=-ds 
+ 


On établit ensuite la série corrigée des variations saisonnières 


À; 


4 = = 
1+5s, 
Dans le cas du modèle multiplicatif, les coefficients saisonniers s’expri- 
ment en pourcentage de la tendance. Ils ont une interprétation plus concrète 
que ceux du modèle additif. 


Le modèle multiplicatif prédit ainsi des valeurs y,: (1 +3) et il est alors 
naturel, pour toutes les dates auxquelles on dispose de la valeur de la 
moyenne mobile, et donc d’une évaluation de la tendance, de considérer les 
résidus et sous la forme : 


* 


ee 


v(1+5) L 


Les écarts entre le modèle et les observations sont égaux à 


€; = 


2-7, (1+5;) = »-(1+s;).e, 


Si le modèle est adapté, les valeurs absolues des écarts ne doivent pas être 
élevées, et leur somme voisine de zéro. 
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C. Autres approches 


On peut chercher à améliorer l’év aluation de la tendance en repassant un 
filtre mo yenne mobile sur la série CVS. On choisit généralement une 
longueur assez faible pour cette nouvelle suite de moyennes mobiles : 5 ou 7 
dans le cas d’une série de période 12, et 3 dans le cas d’une série de période 
4. Avec cette nouvelle évaluation de la tendance, on détermine de nouv eaux 
coefficients saisonniers et une nouv elle série CVS. Cette méthode itérati ve 
pourrait évidemment être poursuivie, mais le gain devient à peu près nul au- 
delà de deux étapes. 

On peut aussi remplacer la moyenne mobile centrée par la médiane mobile 
centrée qui est un filtre non linéaire : au lieu de synthétiser une suite de valeurs 
de la série par une moyenne pondérée, on les résume par leur médiane (par- 
ticulièrement aisée à déterminer à la main avecp = 3). Les médianes mobiles, 
développées par Tukey, sont robustes puisqu’étant fondées sur l’utilisation 
de statistiques d’ordre, elles éliminent les valeurs « singulières » (chapitre 1, 
$ IILB.4). Elles constituent des lisseurs aux propriétés complémentaires des 
moyennes mobiles. Certaines méthodes de désaisonnalisation reposent sur 
une association de ces deux types de lisseurs. 


Disposant des coefficients saisonniers, on peut ajuster la série CVS par 
une fonction, faire une prévision pour la tendance en extrapolant cette fonc- 
tion d’ajustement ou en utilisant une méthode de lissage exponentiel sur la 
série CVS ($ VD). Mais, il ne faut pas oublier que ce mode de prévision ne 
peut être envisagé que sur du court terme puisqu'il suppose une évolution 
future non perturbée par des changements sur l’environnement. 


V. Un exemple de décomposition d'une série 
chronologique 


Pour déterminer la tendance et les coef ficients saisonniers d’une chronique, 
on peut actuellement utiliser un logiciel ou un tableur. 

Néanmoins, une bonne compréhension des méthodes demande de les 
avoir appliquées. On va montrer les étapes successives du traitement de la 
chronique des ventes trimestrielles en France d’essences aviation 
(cf. tableau 4.4). 
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Tableau 4.4 — Ventes en France d'essence aviation (en milliers de tonnes) 


. . . . Moyenne 
1 trimestre 2° trimestre 3° trimestre 4° trimestre 

annuelle 
2005 3,6 7,0 7,6 337 5,5 
2006 3,6 6,7 7,4 3,9 5,4 
2007 3,7 6,4 41 4,1 5,3 

2008 3,6 5,7 71 3,7 5 
Or 7 6,5 7.6 3,9 53 
trimestrielle 


Source : Comité Professionnel du Pétrole 


3 4 £ hé $n- + 
1“ trimestre 05 1‘ trimestre 06 I trimestre 07 1er trimestre 08 


Figure 4.5 — Chronique du tableau 4.4 et suite des moyennes mobiles de longueur 4 


Une saisonnalité de période 4 (nombre de trimestres dans l’année) appa- 
raît sur la représentation graphique ( cf. figure 4.5), ce qui explique que la 
suite des moyennes mobiles de longueur 4 filtre la tendance. 


Pour une décomposition de cette chronique, nous allons envisager succes- 
sivement le modèle additif et le modèle multiplicatif. 


À. Schéma additif 


Pour obtenir la série CVS et la série des résidus, les calculs ont été réalisés à 
l’aide du tableur Excel® selon les étapes indiquées (cf. tableau 4.5). Dans cet 
exemple, la synthèse des coef  ficients saisonniers a été réalisée par la 
moyenne. 
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Tableau 4.5 — Décomposition de la chronique du tableau 4.4 avec le schéma additif 


C4 fe EEE De 


RE 


DS PIE EP ee ee 
BCE ES EEE CE 


most lnslos ns 
slGlRIDIRIEIS lo lola lu lg lwlnlel)es [3 


1 


| 


colonne C : moyennes mobiles de longueur 4 évaluant la tendance 

C4 =(B2/2 + SOMME(B3 : BS) + B6/2)/4, puis « recopier vers le bas » 
colonne D : différence entre valeurs observées et tendance 

D4 = B4 - C4, puis « recopier vers le bas » 
colonne E : E4 = (D4 + D8 + D12) / 3 

ES = (DS + D9 + D13)/3 

E6 = (D6 + D10 + D14) /3 

E7 = (D7 + D11 + D15)/3 


= premières valeurs des 4 coefficients saisonniers qu’on reporte sur 
toute la colonne à l’aide du « collage spécial », option « coller 
valeurs », puis « recopier vers le bas » 


colonne F : calcul des coefficients saisonniers « normalisés » : F2=E2- 5 
puis « recopier vers le bas » 


colonne G : calcul de la série CVS 

G2 = B2 — F2, puis « recopier vers le bas » 
colonne H : calcul de la série des écarts ($ IV.A) 

H4 = G4 - C4, puis « recopier vers le bas » 
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B. Schéma multiplicatif 


Comme pour le modèle additif, les calculs ont été réalisés à l’aide du tableur 

Excel® (cf. tableau 4.6). La synthèse des coef ficients saisonniers a aussi été 

réalisée par la mo yenne. Les différences entre certains résultats donnés dans 

le tableau 4.6 avec ceux obtenus par calcul direct, sont à e xpliquer par le fait 
que Excel® utilise pour les calculs un grand nombre de décimales. 


Tableau 4.6 — Décomposition de la chronique du tableau 4.4 
selon le schéma multiplicatif 


D4 % fx =B4/C4 
A B C (DE E F G H [ J 

1 f X+ Mat) | x4/Maft) 1+54 three CVS 1+e; et Ecart 
2 il 36 0,69 0,70 3,18 
& # 7 1,19 1,20 5,84 

[4] 3 76 5,4 [ 1,39 l 1,36 157 253 1,01 0,01 0,10 
5 4 3,7 3,44 0,68 0,73 0,74 3,03 0,92 -0,08 -0,30 
6 5 36 3,33 0,67 0,69 0,70 5,13 0,96 -0,04 -0,14 
fl 6 67 3,38 125 1,19 1,20 3,59 1,04 0,04 0,26 
8 7 is 5,41 1,37 1,36 1,37 5,40 1,00 0,00 -0,01 
9 8 3,3 3,39 0,72 0,73 0,74 3,30 0,98 -0,02 -0,07 
10 9 3,7 2,31 0,70 0,69 0,70 3,32 1,00 0,00 0,01 
11 10 64 3,30 1,21 1,19 1,20 3,34 1,01 0,01 0,05 
12 il tu 3,31 1,34 1,36 1,37 3,18 0,98 -0,02 -0,18 
13 12 41 35,21 0,79 0,73 0,74 3,57 1,07 0,07 0,26 
14 13 36 3,13 0,70 0,69 0,70 3,18 1,01 0,01 0,04 
15 14 5,7 3,08 1,12 1,19 1,20 4,76 0,94 -0,06 -0,38 
16 si FA 1,36 1,37 3,13 
17 ié 3,7 0,73 0,74 3,03 


colonne C : moyennes mobiles de longueur 4 évaluant la tendance 

C4 = (B2/2 + SOMME(B3:B5) + B6/2)/4, puis « recopier vers le bas » 
colonne D : quotient entre valeurs observées et tendance 

D4 = B4 / C4, puis « recopier vers le bas » 
colonne E : E4 = (D4 + D8 + D12) / 3 

ES = (DS + D9 + D13)/3 

E6 = (D6 + D10 + D14)/3 

E7 = (D7 + D11 + D15)/3 


= premières valeurs des 4 coefficients (1 + s,) qu’on reporte sur toute 
la colonne à l’aide du « collage spécial », option « coller valeurs » 


118 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


colonne F : calcul des coefficients saisonniers « normalisés » : F2=E2- 5, 
puis « recopier vers le bas » 
colonne G : calcul de la série CVS 
G2 = B2 / F2, puis « recopier vers le bas » 
colonne H : calcul de la série (1 +e,) 
H4 = G4 / C4, puis « recopier vers le bas » 
colonne I : calcul de la série e, 
14 = H4 — 1, puis « recopier vers le bas » 
colonne J : calcul de la série des écarts ($ IV.B) 
J4 = C4 - F4 + I4, puis « recopier vers le bas » 


Les séries CVS induites par les deux modèles de composition sont presque 
confondues (cf. figure 4.6). 


8 
x, CYS additif 
7 
6 
5 
4 
CVS multiplicatif 
1‘ trimestre 05 1 trimestre 06 1 trimestre 07 If" trimestre 08 


Figure 4.6 — Séries CVS 


La représentation des séries des écarts (colonne H du tableau 4.5 et 
colonne J du tableau 4.6) permet de comparer les ajustements entre les deux 
modèles et les observations ( cf. figure 4.7). On constate que les deux séries 
des écarts sont presque confondues. 
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Figure 4.7 - Écarts entre les modèles et les observations 


VI. Les méthodes de lissage exponentiel 


Les méthodes de lissage e xponentiel, développées par R. G. Bro wn dans les 
années 60 !, sont des méthodes d’e  xtrapolation qui donnent un poids 
prépondérant aux v aleurs récentes. Elles se caractérisent, en outre, par la 
simplicité des calculs et le petit nombre des données à garder en mémoire. 


A. Le lissage exponentiel simple 


Cette méthode de prévision s’applique à des chroniques sans variations 
saisonnières et à tendance localement constante . On suppose la grandeur 
observée caractérisée par des variations irrégulières autour de la moyenne : 


X=a+e, É=]l,:::,-7 


Les séries économiques présentent souvent un niveau moyen qui évolue 
à travers le temps. Pour la chronique représentée à la figure 4.4, il est clair 


1.R. G. Brown, Smoothing, forecasting and prediction of discrete time series , Prentice Hall, 
1962. 
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que le recours à la moyenne arithmétique des observations conduirait à sous- 
évaluer les valeurs futures. Il convient de donner aux observations les plus 
récentes un poids prépondérant. 


La prévision £,(h) faite par la méthode de lissage exponentiel simple à la 
date T pour l’horizon h, c’est-à-dire pour la date T + h, est la suivante : 


T-1 
Àr(R) = a (1-0): xr., avec 0O<a<l 
i=0 


Le paramètre © est la constante de lissage. Si Test élevé, la somme des 
pondérations est peu différente de 1, en effet : 


aS (1-0 L a. tar = isa 
i=0 


et la prévision À,(A) apparaît comme la moyenne pondérée des valeurs 
X,,... , X. Cette prévision ne dépendant pas de l’horizon h, nous la noterons 
désormais À} 


Cette méthode de prévision repose sur l’idée que les observations influen- 
cent d’autant moins la prévision qu’elles sont éloignées de la date T. En 
outre, on suppose cette décroissance exponentielle. Plus la constante de 
lissage ct est proche de 0, plus l'influence des observations passées remontera 
loin dans le temps et plus la prévision sera « rigide », c’est-à-dire peu sensi- 
ble aux fluctuations conjoncturelles. Au contraire, plus la constante de 
lissage ox est voisine de 1, plus la prévision sera « souple », c’est-à-dire prin- 
cipalement influencée par les observations récentes. 


1) Autres interprétations de la méthode 


e On voit aisément que : 
Àr = (1-@)-Êr 1 +0 -xr (1) 
La prévision apparaît comme la moyenne pondérée entre la prévision 


Àr_, faite à la date T — 1 et la dernière observation x7, le poids donné à cette 
observation étant d’autant plus fort que « est plus élevé. 


Dans le cas où © est égal à 1 : À, = s,, ce qui signifie que la prévision 
est égale à la dernière valeur observée, on parle de prévision « naïve ». 
e On peut encore écrire : 
Àr = Êr + (xr-Ër_ 1) (2) 
La prévision apparaît alors comme égale à la prévision à la date précé- 
dente corrigée d’un terme proportionnel à la dernière erreur de prévision. 


Dans ces deux formules qui fournissent des méthodes élémentaires de 
mise à Jour de la prévision, l’information apportée par le passé est résumée 
dans Àr ; 
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e On peut montrer que la valeur de a qui minimise la quantité : 


Tai 
Ya) 0) 
i=0 

est la suivante : 


T-1 

>ÙÜ — &):xr.; 

i=0 à 
EE e—— — 5 XT 

1-(1-a)7 
La prévision s’interprète alors comme la constante qui s’ajuste le mieux 

à la série « au voisinage » de T, l’expression « au voisinage » traduisant le 
fait que dans la minimisation, l’influence des observations décroît lorsqu'on 
s’éloigne de la date 7. 


S 


Cette dernière interprétation montre clairement que le lissage exponentiel 
simple ne s’applique que si la chronique peut être approchée par une droite hori- 
zontale au voisinage de 7, ce qui implique une tendance localement constante. 


2) Propriétés du lissage exponentiel simple 


1. La chronique lissée {£,, 1 = 1,... ,T } a une variance inférieure à celle 
de la chronique initiale {x,, = 1,... ,1 } Comme tout filtre, le lissage expo- 
nentiel simple réalise un « écrêtage » des irrégularités de la série. 


2. Le lissage exponentiel simple est un filtre linéaire. 


3. De même que la moyenne mobile, le lissage exponentiel simple 
s’adapte avec retard à un changement de niveau de la chronique (cf. figures 4.4 
et 4.8). C’est de la valeur de la constante de lissage © que dépendent la sta- 
bilité et le taux de réponse de la série lissée, ces deux caractéristiques ayant 
un aspect complémentaire. 


3) Mise en œuvre de la méthode 


a) Initialisation 

La méthode du LES utilisée à l’aide des formules (1) ou (2) nécessite 
l’initialisation de l’algorithme. On prend généralement À, égal à x, ou À, égal 
à x (initialisation par déf aut du logiciel SPSS), et il est clair que la v  aleur 
choisie pour À, aura d’autant moins d’influence sur que T sera grand. 


b) Choix de la constante de lissage 


Ce choix peut se f aire selon des critères subjectifs de « rigidité » ou de 
« souplesse » de la prévision. Mais une méthode plus objecti ve consiste à 
choisir & minimisant : 
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e soit l’ Erreur Quadratique Moyenne de prévision : 


RS . 
EQOM = pi 2 Cr si 
e soit l’ Erreur Absolue Moyenne de prévision 
1 7 
EAM = 2 î, 


Il ne faut pas manquer d’examiner aussi l” Erreur Moyenne de prévision 
qui peut indiquer dans certains cas une sous-évaluation ou une surévaluation 
systématique de la prévision qui s’observe d’ailleurs à l'examen des graphi- 
ques des séries initiales et lissées : 


EM = = Dar © 


La minimisation de ces critères peut être faite sur toute la série des 
erreurs de prévision ou sur un pourcentage donné de ses derniers termes 
(dans ce cas, on prend souvent le dernier tiers de la série, tableau 4.7). Cer- 
tains logiciels proposent actuellement les méthodes de lissage avec une 
constante & déterminée par la minimisation d’un critère. Le logiciel SPSS 
calcule la constante optimale en minimisant l’Erreur Quadratique Moyenne 
de prévision. 


* À =0,4*83+0 5°C3 
A | 8 [sc] D Rens. 

x: LES a=04 
130 140 
121 130,00 
120 [126,20 _ . 
127 123,84 Le s— 
122 125,10 
129 123,86 
124 12592 139 
120 125,15 
139 123,09 
136 | 129,45 12 
135 13207 _. 
134 13324 : 
136 133,55 La —n— LES a = 04 
133 134,53 
138 13392 
133 135,55 us 

134,53 1,2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 

134,53 


Figure 4.8 — Chronique du tableau 4.6 et série obtenue par LES avec = 0,4 
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Tableau 4.7 — Présentation des calculs du LES avec les critères calculés 
sur le dernier tiers de la série 


@ = 0,4 a = 0,5 

t x, LES e, ABS (e;) (e)? LES e, ABS (e;) (e} 

1 | 130 

2 | 121 | 130,00 | —9,00 9,00 81,00 130,00 | —9,00 9,00 81,00 
3 | 120 | 126,40 | —6,40 6,40 40,96 125,50 | -5,50 5,50 30,25 
4 | 127 | 123,84 3,16 3,16 9,99 122,75 4,25 4,25 18,06 
5 | 122 | 125,10 | —3,10 3,10 9,63 124,88 | —2,88 2,88 8,27 
6 | 129 | 123,86 5,14 5,14 26,39 123,44 5,56 5,56 30,94 
7 | 124 | 125,92 | —-1,92 1,92 3,68 126,22 | —-2,22 2,22 4,92 
8 | 120 | 125,15 — 5,15 5,15 26,53 125,11 | -5,11 5,11 26,11 
9 | 139 | 123,09 15,91 15,91 253,12 122,55 16,45 16,45 270,45 
10 | 136 | 129,45 6,55 6,55 42,85 130,78 5,22 5,22 27,28 
11 | 135 | 132,07 2,93 2,93 8,57 133,39 1,61 1,61 2,60 
12 | 134 | 133,24 0,76 0,76 0,57 134,19 | —0,19 0,19 0,04 
13 | 136 | 133,55 2,45 2,45 6,02 134,10 1,90 1,90 3,62 
14 | 133 | 134,53 — 1,53 1,53 2,33 135,05 | —2,05 2,05 4,20 
15 | 138 | 133,92 4,08 4,08 16,67 134,02 3,98 3,98 15,81 
16 | 133 | 135,55 — 2,55 2,55 6,50 136,01 | —3,01 3,01 9,07 
17 134,53 134,51 

EM = EAM = | EOM= EM = EAM= | EOM = 
0,64 2,27 6,42 0,12 2,23 6,55 


Le tableau 4.8 donne, selon la constante de lissage @ variant par pas de 
0,1, les valeurs des critères EM, EOM et EAM pour le LES appliquées à la 
série de la figure 4.8, ces critères ayant été calculés sur le dernier tiers de la 
série, c’est-à-dire avec les cinq dernières erreurs de prévision. 

Le critère EOM est minimum pour © = 0,4, le critère EAM pour & = 0,5 
et la valeur absolue de l’erreur moyenne est minimum pour œ=0,5 


Tableau 4.8 — Valeurs des critères calculés sur le dernier tiers de la série du tableau 4.7 


Valeur de ot EM EQM EAM 
0,1 4,548 25,311 4,548 
0,2 2,931 14,068 3,101 
0,3 1,545 8,151 2,495 
0,4 0,643 6,421 2,274 
0,5 0,125 6,547 2,227 
0,6 — 0,148 7,361 2,449 
0,7 — 0,280 8,436 2,648 
0,8 — 0,339 9,670 2,833 
0,9 — 0,369 11,095 3,012 
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B. Le lissage exponentiel double 


Le lissage e xponentiel double est une généralisation du lissage e xponentiel 
simple au cas d’une chronique à tendance localement linéaire ; on suppose 
que la série peut être ajustée par une droite au voisinage de T: 


X= (7) + a) - (t-T) 
Les coefficients a,(T) et a,(T) sont choisis de façon à minimiser la quan- 
tité suivante qui est l’analogue de la quantité (3) minimisée pour le lissage 
exponentiel simple : 


T-1 | 
DU) x {a(r) + (7) (à) 


i=0 
On obtient la solution suivante : 


T-1 | 
AG) =28 (T8 070 S\(T) = a ÿ (1-0) -xr_; 


i=0 
avec 


à œ — 
a(T) = (sn -5,0) Sri= aŸ (1 a. S(T-5) 
i=0 


ce qui conduit à la prévision : &,(h) = à,(T)+à,(T)-h 


La quantité S,(7) résultant du lissage exponentiel simple de la série 
{x,, 1=1,... ,T} et la quantité S,(7) du lissage exponentiel simple de la 
série {S,(f), 1 = 1,... ,1 } — d’où le nom de lissage exponentiel double, on 
dispose pour leurs calculs des formules de mise à jour du LES : 


Le = œ-xr+(1-a)-S(T-1) 
S,(T) = Q-S(T)+(1-@)-S;(T-1) 


L’initialisation de ces formules de mise à jour peut être : 


ne = x 
S,02) = (2) 


SÉRIES CHRONOLOGIQUES ET PRÉVISION e 125 


En développant les égalités ci-dessus, on obtient les formules de mise à 
jour des coefficients 4,(T) et à,(T) : 


à\(T) = (TD) +@(T-1)# (1 (1-02) (xrêr (0) 
ES 0) 
GT) = a(T-1)+0 -(xr-%r (1) 


à1(2) 


à3(2) = xx: 


Penh x X2 
L’initialisation de ces formules peut être : 


Comme pour le lissage exponentiel simple, le choix de la constante de 
lissage © peut se faire par la minimisation d’un critère choisi. 


La méthode de Holt-Winters étend les méthodes de lissage exponentiel 
aux séries saisonnières. C’est une méthode de prévision très utilisée. 
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Testez-Vous (es réponses sont données page 286) 


Il y a au moins une réponse exacte par question. 


1. Pour une chronique à 12 termes : 

a) on peut calculer 8 moyennes mobiles centrées de longueur 4 
b) on peut calculer une moyenne mobile centrée de longueur 12 
c) on peut calculer 10 médianes mobiles centrées de longueur 3 


d) on peut calculer 2 moyennes mobiles centrées de longueur 11 


2. Identification du modèle de décomposition adapté : 
a) si le facteur saisonnier est proportionnel à la tendance, on choisit le modèle additif 


b) si les deux courbes joignant respectivement les maxima et les minima sont quasi- 
parallèles sur un graphique à ordonnée logarithmique, on choisit le modèle multipli- 
catif 


c) si les maxima de la courbe représentative de la chronique sont distants de 5 dates, 
on choisit le modèle additif 


d) on peut toujours ramener un modèle multiplicatif à un modèle additif 


3. Si une chronique X a une composante saisonnière de période p, alors : 
a) les moyennes mobiles centrées de longueur 2 p éliminent la saisonnalité 


b) on peut approximer la tendance par la suite des moyennes mobiles centrées de 
longueur p 


c) la somme de p termes successifs de X donne une approximation de la moyenne de 
la tendance 


d) on peut toujours calculer (T — p) moyennes mobiles centrées de longueur p si elle 
a T termes 


4. Une prévision par lissage exponentiel simple : 


a) tient d’autant plus compte des valeurs récentes de la série que la constante © est 
faible 


b) peut s’envisager pour une chronique possédant une composante saisonnière 
c) ne peut pas s’envisager pour une chronique possédant une tendance à la hausse 


d) s’adapte d’autant plus rapidement à un changement de niveau de la chronique que 
ox est élevée 
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Exercices (corrigés page 309) 


Exercice 4.1 


On dispose aussi de la répartition mensuelle du niveau de l’indice de la qualité de 
l’air ATMO dans l’agglomération parisienne selon trois classes de niveau pour les 
six années agrégées. 


Fréquences mensuelles d'apparition des indices de 1998 à 2003 


Niveau 1à4 5à7 8 à 10 Nombre total de jours 
Janvier 164 22 0 186 
Février 136 29 4 169 
Mars 151 35 0 186 
Avril 152 28 0 180 
Mai 132 54 0 186 
Juin 115 65 0 180 
Juillet 123 59 4 186 
Août 93 83 10 186 
Septembre 155 25 0 180 
Octobre 155 31 0 186 
Novembre 172 8 0 180 
Décembre 177 9 0 186 
Nombre total de jours 1725 448 18 2191 


Légende : Niveau 1 à 4 : très bon à bon. 
Niveau 5 à 7 : moyen à médiocre. 
Niveau 8 à 10 : mauvais à très mauvais. 


On s'intéresse à la classe de niveau « 5 à 7 ». 
1. Représentez graphiquement son évolution au cours des 12 mois. 


2. Calculez la suite des moyennes mobiles de longueur 3 et représentez-la sur le 
même graphique. Quelle propriété de la moyenne mobile venez-vous d'illustrer ? 


Exercice 4.2 


t 1 2 3 4 5 6 7 8 9 10 | 11 12 


2 31e It té le | #l81z l$ | 


1. Calculez les suites des moyennes mobiles de longueurs 2, 3, 4 et 5. 


Quelles sont les propriétés de la moyenne mobile qui sont illustrées par cet 
exemple ? 


2. Soit la chronique z,= 10 — 25 + x, , calculez la suite des moyennes mobiles de 
longueur 4 de la nouvelle série z, 
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Exercice 4.3 


Le tableau suivant donne la série chronologique bimestrielle du transport des voya- 
geurs sur le réseau Air France International (en milliards de passagers-km) de 2002 
à 2005. 


Janv.-Fév | Mars-Avril | Mai-Juin | Juil.-Août | Sept.-Oct. | Nov.-Déc. 


2002 13,3 15,1 14,8 16,3 14,8 14,2 
2003 13,8 14,2 14,1 17,0 15,2 14,8 
2004 14,4 16,0 16,2 18,5 16,2 15,3 
2005 15,4 16, 8 17,4 19,9 17,9 17,4 


Source : www.insee.fr 


1. On choisit de modéliser cette chronique par un schéma additif. Justifiez ce choix. 


2. Déterminez la tendance de cette chronique par la suite des moyennes mobiles de 
longueur adaptée, et représentez-la sur le même graphique que la série initiale. 


3. Calculez les coefficients saisonniers. 


4. Calculez la série corrigée des variations saisonnières. Ajustez cette chronique par 
une droite en utilisant la méthode des moindres carrés. 


5. Au vu des résultats, quelles prévisions pouvait-on faire fin 2005 pour janvier- 
février, mars-avril et mai-juin 2006 ? 


6. Sachant qu’on a observé 17,2 milliards de passagers-km en janvier-février 2006, 
18,5 en mars-avril et 18,6 en mai-juin, calculez l’erreur absolue moyenne de pré- 
vision. 


Exercice 4.4 


1. Voici pour ses trois premiers mois d’ouverture, le nombre de places x; vendues 
par semaine par le cinéma PARADISO ( désignant le numéro de la semaine varie 
de 1 à 12) : 


t 1 2 3 4 5 6 7 8 9 10 11 12 


x, | 3428 | 3295 | 3376 | 3195 | 3573 | 3334 | 3434 | 3300 | 3703 | 3411 | 3545 | 3 327 


t 


1. Représentez cette chronique graphiquement. A-t-elle une composante saisonnière ? 
Si oui, de quelle période ? 


2. Calculez la suite des moyennes mobiles de longueur appropriée pour évaluer la 
tendance de la série chronologique. Représentez cette suite sur le graphique pré- 
cédent. 


3. On choisit un modèle multiplicatif. Évaluez les coefficients saisonniers. 


4. Calculez la série corrigée des variations saisonnières (série CVS) et représentez-la 
sur le graphique précédent. Calculez la série des résidus. 


5. Ajustez la série CVS par une droite en utilisant la méthode des moindres carrés. 
Représentez cette droite sur le graphique précédent. 


6. Donnez une prévision pour le nombre de places vendues pendant les deux pre- 
mières semaines du quatrième mois. 
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Exercice 4.5 


La demande d’un certain article a été relevée au cours de 15 mois consécutifs 


Mois il 2 3 4 5 6 7 8 9 10 11 12 13 14 15 


Demande | 37 41 39 40 42 39 41 39 42 41 40 42 43 40 42 


1. Appliquez un lissage exponentiel simple à cette série chronologique en 
prenant & = 0,6 jusqu’au 6° mois inclus et & = 0,3 pour les mois suivants. Tracez 
sur le même graphique la chronique initiale et la série lissée. 


2. Justifiez le changement de valeur de la constante de lissage ©. 


3. Calculez l’erreur moyenne, l’erreur absolue moyenne et l’erreur quadratique 
moyenne. 


4. Donnez les prévisions de la demande pour les trois mois suivants. 


Exercice 4.6 


Le tableau ci-dessous donne les valeurs des indices trimestriels (base 2000) de la pro- 
duction industrielle des boissons pour les années 2002 à 2005 


1® trimestre 2e trimestre 3° trimestre 4 trimestre 
2002 94,2 105,3 103,5 127,5 
2003 98,3 103,8 115,7 125,5 
2004 100,9 110,7 106,6 126,3 
2005 98,7 109,8 110,8 129,4 


Source : www.insee.fr 


1. Commentez l’évolution de cette série chronologique en utilisant sa représentation 
graphique. Justifiez le recours à un schéma de composition additif. 


2. Déterminez la tendance de cette chronique par la suite des moyennes mobiles de 
longueur adaptée, et représentez-la sur le même graphique que la série initiale. 


3. Calculez les coefficients saisonniers et la série corrigée des variations saison- 
nières. 
4. Appliquez un lissage exponentiel simple à la série CVS avec & = 0,3. 


5. Quelles prévisions pouvait-on faire au dernier trimestre 2005 pour les deux pre- 
miers trimestres 2006 ? Sachant que cet indice a pris les valeurs 100,8 et 110,8 
pour les 1 ® et 2€ trimestres 2006, calculez l’erreur moyenne et l’erreur absolue 
moyenne de prévision. 


130 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


b, M odèle probabiliste 


et variable aléatoire 


Il ne faut donc pas se demander si nous percevons vraiment un monde, il faut se dire au 
contraire : le monde est cela que nous percevons. 


Phénoménologie de la perception, Maurice Merleau-Ponty (1908-1961) 


a statistique descriptive permet de résumer les mesures d'une ou 

plusieurs grandeurs obtenues sur les individus d'un échantillon ou 

d'une population par un classement (tri simple dans le cas d'une 
seule variable, tri croisé dans le cas de plusieurs variables). Une grandeur 
est alors décrite par sa distribution, qui est déterminée à partir des obser- 
vations, justifiant ainsi le nom de distribution empirique de la grandeur 
(ou de la variable). C'est la représentation « de base » pour apprécier 
une grandeur après qu'elle a été classée. 
L'observation de nombreuses distributions empiriques montre pour cer- 
taines d'entre elles des analogies de formes, et des caractéristiques voi- 
sines. Ceci conduit à définir des distributions théoriques afin de disposer 
d'instruments plus formels regroupant les propriétés. Ces distributions 
théoriques sont une abstraction destinée non pas simplement à présen- 
ter les données, mais à les interpréter ou à les expliquer. Ce parallélisme 
entre l'observation et la représentation théorique se retrouve également 
au niveau de l'observation individuelle qu'on replace dans un ensemble 
potentiel d'observations supposées homogènes. Les variations entre dif- 
férentes observations sont considérées comme des fluctuations non attri- 
buables à une cause identifiée (contrôlable ou non), et on dit alors 
qu'elles sont le résultat du hasard. 
Il est nécessaire de disposer d'un outil théorique permettant de considé- 
rer globalement les différentes observations provenant d'une même 
population en tenant compte d'une part, de l'homogénéité liée à leur 
origine commune et d'autre part, des fluctuations entre observations. 
C'est le concept de variable aléatoire qui remplit ce double rôle. Son 
intérêt dépend des propriétés générales qu'on pourra lui associer, et de 
leur fiabilité. 
Le calcul des probabilités (puis son axiomatique) est le support formel de 
cette représentation. || a été introduit initialement au  xviie siècle pour 
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étudier les jeux de société (dés, cartes, roulette), et son développement 
a permis une approche intégrant les éléments fluctuants et non perma- 
nents des phénomènes physiques, sociaux ou encore psychologiques. Les 
probabilités se fondent sur la notion d' expérience aléatoire, c'est-à-dire 
dont les conditions d'exécution bien que parfaitement définies, ne per- 
mettent pas de s'assurer à priori de l'issue de l'expérience. 

À contrario les expériences, dites déterministes, celles dont le résultat est 
maîtrisé par les conditions initiales, ont un seul résultat possible, en 
négligeant les éventuelles erreurs de mesure. Ces situations s'opposent 

à celles où le hasard intervient dans le résultat attendu et pour lesquelles 
on parle d'incertitude. C'est pour ce dernier contexte qu'a été fondé le 
calcul des probabilités. Sous le terme de hasard, on a longtemps résumé 
les facteurs considérés comme mineurs ! dans l'étude d'un phénomène. 
On pourrait plutôt dire actuellement qu'entre déterminisme et incerti- 
tude repose toute la notion de ce qui échappe au contrôle, ou encore de 
l'information non disponible. 

Le caractère aléatoire d'une grandeur peut être partie intrinsèque du 
phénomène étudié. C'est le cas du résultat d'un jet de dé, ou bien de la 
quantité de fuel consommé annuellement en France. Dans d'autres cas, 

il n'en est pas ainsi. Si on s'intéresse à la distance moyenne parcourue sur 
une autoroute par les automobilistes passant à un poste de péage 
donné, un certain jour, on peut interroger tous les automobilistes se pré- 
sentant au péage et calculer la moyenne. On peut aussi chercher cette 
information en interrogeant un échantillon d'automobilistes se présen- 
tant à ce péage. La valeur moyenne observée sur cet échantillon va 
dépendre de l'échantillon retenu qui n'est pas lui-même fixé à l'avance 
(il y a beaucoup d'échantillons possibles), et peut être considéré comme 
le résultat d'une expérience aléatoire (le choix de l'échantillon d'auto- 
mobilistes). Ainsi, alors qu'initialement le problème se posait en termes 
déterministes, la procédure surajoutée de choix de l'échantillon introduit 
un élément aléatoire. La grandeur étudiée (moyenne) n'est pas elle- 
même aléatoire, mais les données recueillies sur l'échantillon le sont 
puisque le contenu de l'échantillon n'est pas déterminé par son mode de 
tirage. 

L'objectif du calcul des probabilités est l'analyse et l'explication des phé- 
nomènes non déterministes. Ses fondements théoriques, et en particulier 
l'axiomatique de Kolmogorov, lui donnent une valeur scientifique rela- 
tivisée toutefois par la signification de la notion de probabilité. 


1. Historiquement, ces facteurs « mineurs » ont été d’abord restreints à la notion d’erreur. 
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1. Eléments de calcul des probabilités 


Le calcul des probabilités est basé, comme nous l’avons déjà vu, sur la notion 
d'expérience aléatoire. On associe à une telle expérience 6 l’ensemble de 
tous les résultats possibles, appelé ensemble fondamental, qu’on désigne 
communément par Q. Chaque résultat possible est une partie de ©. 


L'ensemble fondamental associé à une épreuve non déterministe peut 
contenir un nombre fini d'éléments (de la forme { &@,, @;,... , @,}) ou bien 
être de type infini dénombrable! ou enfin être de type infini non dénombra- 
ble. On assimile, comme dans la théorie classique des ensembles, un évé- 
nement, donc une partie de Q, à la propriété qui le caractérise au sein de 
l’ensemble fondamental, c’est-à-dire à la réalisation de cette propriété. On 
désigne par & le résultat qui sera observé à l’issue de l’expérience aléatoire, 


etonécrit He G (avec GC P(@)) lorsque la situation décrite par G est 
le résultat de la réalisation de l’épreuve E. La non-réalisation de l’événe- 


ment G est notée me G(où G désigne l’ensemble complémentaire? de G 
dans Q). 


La notation et le vocabulaire ensembliste sont tout à fait adaptés à la des- 
cription des situations aléatoires, et l’événement dont on a la certitude de la 
réalisation est désigné par Q (événement certain), tandis que l’événement 
dont on sait qu’il ne se produira pas est désigné par © (événement impossi- 
ble). La réunion ensembliste G L H correspond à la réalisation d’au moins 
un des événements G et H. L’intersection ensembliste G N H correspond à 
la réalisation des deux événements G et H. L’incompatibilité de G et H se 
traduit par G N H = ©. Enfin, la différence ensembliste G — H correspond à 
la réalisation de G et à la non-réalisation de  H, ou encore à l’intersection 
Gn AH. 

La représentation ensembliste justifie la caractérisation des issues d’une 
épreuve aléatoire au sein d’une structure mathématique sur laquelle on pourra 
définir une probabilité. Cette structure est celle d’une algèbre de Boole (cas 
fini), ou d’une 6-algèbre (cas infini). 


A. Notion de probabilité 


Soit Q l’ensemble fondamental associé à une épreuve aléatoire et p (Q) 
l’ensemble des parties de Q. 


1. C'est-à-dire pouvant être mis en bijection avec tout ou partie de l’ensembleN des entiers naturels. 
2. Le complémentaire de l’ensemble G est noté indifféremment G ou G£. 
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On dit que $ & P(Q) est une algèbre de Boole si les deux conditions 
suivantes sont vérifiées : 


*Cl:Ge$=Ge 
°C2:Ge fetHe f=GLUHES 


Cette structure d’algèbre de Boole correspond à la traduction ensembliste 
de la logique des événements dans le cas où l’ensemble fondamental est fini. 


On dit que # & P (Q) est une 6-algèbre de Boole (ou plus simplement 
une G-algèbre) si les deux conditions suivantes sont vérifiées 


«Cl:GeA-=Ged 


°C2:G;e A pourie N = ÜUc,e 4 


ieN 


* La notion de 6-algèbre étend la correspondance entre la logique événe- 
mentielle et la théorie des ensembles au cas d’épreuves aléatoires dont 
l’ensemble fondamental est infini. 


On notera que si E est un événement quelconque de Q, 4 = {©, ©, E, E 
est une G-algèbre. 


Lorsqu'on a défini une o-algèbre SL d'événements de Q, on dit que le 
couple (Q, SA) est un espace probabilisable dans le sens où il ne reste plus 
qu’à préciser la probabilité de chaque événement de # 


Les premières fondations de la notion de probabilité! visaient à définir une 
échelle ordonnée des chances de réussite à certains jeux. L'approche fréquen- 
tiste qui en a résulté est construite sur l’observation et le dénombrement de 
situations dites élémentaires, c’est-à-dire représentant toutes les issues diffé- 
rentes de l’épreuve aléatoire. Ce point de vue ne peut s’appliquer qu’à des 
cas où l’ensemble fondamental associé est fini. 


On suppose tout d’abord que les événements élémentaires ont une chance 
égale de réalisation, contexte dit d”’ équiprobabilité, ce qui implique l’additi- 
vité des chances. Pour cette hypothèse et pour un ensemble fondamental de 
type fini, on définit la probabilité d’un événement comme l’analogue d’une 
fréquence relative afin d’avoir une échelle de valeurs comprise entre 0 et 1, 
et de disposer d’une mesure additive  : pour des événements élémentaires 
équiprobables, la probabilité d’un événement quelconque 4 est sa fréquence 
relative d’apparition dans l’ensemble fondamental. Ce point est connu sous 
le nom de règle de Laplace. 


1. Blaise Pascal et Pierre de Fermat correspondent en 1654, sur la répartition équitable des 
enjeux dans les jeux de hasard ; et Christian Huyghens, en 1657, formule et résout le problème 
dit de la ruine du joueur. 
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Donnons-en un exemple d’application, en calculant la probabilité de faire 
apparaître les chiffres 4, 2 et 1 en lançant trois dés parfaitement équilibrés. 
Chaque dé possède 6 faces, ce qui implique que l’ensemble fondamental  Q 
possède 63 = 216 éléments. Dans cet ensemble fondamental formé des figu- 
res à 3 chiffres entre 1 et 6, celles qui permettent de reconstituer « 421 » sont 
toutes les 3 ! = 6 permutations des trois chiffres 1, 2 et 4. La fréquence rela- 
tive de la figure « 421 » ou probabilité de l’événement « obtention des chif- 
fres 4, 2, 1 » est égale à 1/36 

Dès lors que l’ensemble fondamental n’est pas fini et/ou que l’équiproba- 
bilité n’est pas assurée sur les événements élémentaires de (2, on ne peut plus 
appliquer cette règle du nombre de cas favorables sur nombre de cas possi- 
bles. On doit généraliser cette démarche et définir abstraitement la probabilité 
pour qu’elle coïncide avec la règle de Laplace lorsque cette dernière s’appli- 
que. On utilise alors la représentation ensembliste des événements pour défi- 
nir une probabilité sur un espace probabilisable ( Q, 54). 


Soit (Q, 4) un espace probabilisable. Une probabilité! P sur cet espace 
est une application de SL à valeurs dans l’intervalle [0;1] vérifiant : 
DAC) 

li) pour des événements {G;Ee die NI} incompatibles GZj= G;n G =(2)): 


FU) : ZPCG) 


On dit alors que le triplet (Q, SL, P) est un espace probabilisé. I est cons- 
truit sur une épreuve aléatoire dont on se donne l’ensemble fondamental  Q, 
tous les événements simples ou complexes étant décrits par À, sur laquelle 
on se donne l’échelle des chances P. 


De cette définition, ou axiomatique de Kolmogorov, on déduit les proprié- 
tés suivantes : 


1.SiGe À, alors P(G) +E- P(G) 
Eneffet,ona:Gn<& et GU G = Q, ce qui donne : 


P(Q)=1= P(GU G)=P(G)+P(G) 
2. La probabilité de l’événement impossible est nulle : P(@) = 0 
Il suffit d’appliquer la propriété précédente en posant G=Q 


1. On dit encore une mesure de probabilité pour bien faire référence aux qualités métrologiques 
de cette application. On désignera indifféremment par la suite la probabilité par Pr ou par P. 
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3. SiGe À et HE À sont tels que G C H, alors P(G) < P(H) 
Puisque H=GU(G NnHetque GN(G NH)=S,ona: 
P(H) = P(G) + P(G N H),et P(G N H) > 0 implique P(H) > P(G) 


Il est important de noter que l’inégalité entre les probabilités est au sens large. 


4. Si G et H sont deux éléments quelconques de À : 

P(G © H) = P(G) + P(H) - P(G N H) 
En effet, ona : GUH=GU(G NnH)avec GN(G NH)=Q 
donc P(G L H)=P(G)+ P(G NH) 
De même H=(GNH)LU(G NnHave(GNDHDNn(GNnH=-oQ 
donc P(H)=P(GN H)+P(G NH) 
En combinant les deux résultats, on obtient : 

P(G L H) = P(G) + P(H) - P(G N H) 


Ce dernier résultat est connu sous le nom de théorème des probabilités 
totales. 


B. Psobabilités conditionnelles 


Nous avons évoqué en introduction de ce chapitre le lien particulier entre 
l'information disponible, le contrôle des facteurs déterminants d’un phénomène 
et l'importance de sa partie aléatoire, donc de sa probabilité de réalisation. 
Nous allons retrouver ceci au travers de la notion de probabilité conditionnelle. 


Soit une épreuve aléatoire donnée, munie de son ensemble fondamental Q, 
de la 6-algèbre des événements, et de la probabilité P associée à chacun de ces 
derniers, en d’autres termes, nous supposons donné un espace probabilisé 
(Q, 4, P). La connaissance d’une information complémentaire sur le déroule- 
ment de l’épreuve équivaut à la modification des probabilités définies sur les 
éléments de 4. En effet, cette information acquise n’est autre qu’une condition 
désormais supposée réalisée quel que soit le résultat de l’expérience aléatoire. 
Prenons-en un exemple. Nous avons vu que la probabilité de réaliser la 
« figure 421 » lors du jet de 3 dés était de 1/36. Supposons maintenant que le 
premier dé soit lancé avant les deux autres, et qu’il fasse apparaître le chiffre 
2. L'ensemble fondamental associé au jet des 2 dés restant contient 36 événe- 
ments élémentaires, mais parmi ceux-ci, seuls les couples (4 ;1) et (1 ; 4) permet- 
tent de compléter la configuration « 421 ». On en déduit donc que si on sait que 
le premier dé a affiché la valeur 2, la probabilité de réaliser un 421 est de 1/18. 


On remarque dans cet exemple que l’ensemble fondamental a été modifié, et 
donc aussi la 6-algèbre des événements, ainsi que la mesure de probabilité  P. 
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Cette modification s’appelle un conditionnement, car elle correspond à la prise 
en compte d’une condition supplémentaire sur la réalisation de l’épreuve aléa- 
toire (ici le fait que le premier dé doit être lancé séparément et qu’il affichera la 
valeur 2). On est ainsi conduit à définir les probabilités conditionnelles. 


Définition 1 


Soit (Q, S, P) un espace probabilisé et soit C € 5 un événement par- 
ticulier, appelé condition, de probabilité non nulle. Pour tout événement 
À € &, on appelle probabilité conditionnelle de À sachant C  , notée 
P(A|C), la quantité : 

P(AIC) = JAONC) 
P(C) 

Cette définition est bien évidemment dérivée de l’approche fréquentiste des 
probabilités puisqu’en raisonnant avec la règle de Laplace, on pourrait dire que 
les cas favorables sont ceux où les événements À et C sont tous deux réalisés, 
alors que les cas possibles sont ceux pour lesquels de toutes façons l’événement 
C'est observé. II faut noter qu’une probabilité conditionnelle n’a de sens que si 
la condition est réalisable (de probabilité non nulle). La notion de probabilité 
conditionnelle, ou encore de conditionnement des probabilités, revient à modi- 
fier l’ensemble fondamental puisque l’événement C € S se trouve être rap- 
porté à une probabilité égale à un. Ainsi, sur la figure 5.1, par conditionnement 
la probabilité de À devient ramenée à la seule part de A incluse dans C. 


Figure 5.1 - Conditionnement d’une probabilité 


On peut vérifier que l'application qui àtout A e associe P(A |C) est 
bien une mesure de probabilité. 


Propriété 
Si A,, A», , À, sont n événements quelconques d’une 6-algèbre Et) 
d’un espace probabilisé (2, S, P), on peut écrire : 
PAL AL DA,) = 
P(A;) É P(A;[4;) F Do P(A,JA: N À; M …. NA, 1) 
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En effet, si n = 2, cette propriété n’est autre que la formule de définition des 
probabilités conditionnelles. Supposons cette propriété vraie à l’ordre n—1: 


P(A;INA;N...NA,_;) = 
PA): P(A;lA:)-.. PO, 1 A NAN OA, 2) 
et montrons qu’elle est encore vraie à l’ordre n. 
On peut écrire A. MA, NA, = (A NA,...NA, )NA, 
On pose :B = A, MA,nN...nNA,_, et on obtient : 
P(A NAN... nNA,)=P(A,;NB)= P(4,]|B) : P(B) 
soit : 
P(A;NA,;N...nNÀA,) = 
PA,|ANA,N... NA, 1): PQA:;):PQ;]4;) :...: PA, |A NAN... NA, ) 


n- n- 


Définition 2 


Deux événements À et B d’un espace probabilisé ( Q, SL, P) sont dits 
indépendants en probabilité si la réalisation de l’un d’eux ne modifie pas 
la probabilité de survenue de l’autre. 


Il s’agit d’une relation symétrique. On parle également d'événements sto- 
chastiquement indépendants. Dans la suite de ce livre, on écrira toutefois 
simplement événements indépendants. 


On voit alors que si A et B sont deux événements indépendants, on a : 
P(A]|B) = P(A) 
P(B]|A) = P(B) 
et chacune de ces égalités montre que : 
À et B indépendants & P(A NB) = P(A) : P(B) 

D'autre part, il est important de ne pas confondre les notions d’indépen- 
dance et d’incompatibilité. Dans le premier cas, si les deux événements À et 
B sont de probabilité non nulles, alors la probabilité P(A © B) est aussi non 
nulle. Dans le second cas, même si À et B sont de probabilité non nulles, 
l'intersection (A N B) est de probabilité nulle. II s’ensuit que deux événe- 


ments à la fois indépendants et incompatibles sont tels qu’au moins l’un 
d’eux est un événement impossible (c’est-à-dire de probabilité nulle). 


Notons encore que si À et B sont deux événements indépendants, alors : 
P(AIB) = P(AIB) = P(A) 
P(B|A) = P(B]|A) = P(B) 
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Cette notion d’indépendance s’étend à plus de deux événements. 


Définition 3 
Soient 7 événements d’un espace probabilisé ( Q, A, P). On dit qu'ils 
sont mutuellement indépendants si quels que soient À,, À,, .… , À, choisis 


parmi ces ñ événements, on à : 
PA D AA 6% NA) & Pb) : PA) + 0 © P(A,) 


Des événements mutuellement indépendants sont indépendants deux à deux 
(simple application particulière de la définition), mais des événements À,, 4;, …., 
À, qui sont indépendants deux à deux ne sont pas toujours mutuellement indé- 
pendants. 


Cette notion d’indépendance sera étendue plus loin au cas des variables aléatoi- 
res, et peut aussi être généralisée à plusieurs épreuves (ou expériences aléatoires). 

La mise en œuvre des probabilités conditionnelles a conduit à une réflexion 
très importante sur le concept de probabilité lui-même, ce que nous verrons plus 
loin. C’est certainement l’apport de Thomas Bayes ! qui en a représenté le point 
de départ. Nous donnerons donc d’abord le résultat connu sous le nom de théo- 
rème de Bayes, pour examiner ensuite le débat sur la notion de probabilité. 


Théorème de Bayes 


Soit (Q, 4, P) un espace probabilisé, et soient A,, A... , À, un ensem- 
n 


ble d'événements deux à deux incompatibles vérifiant U A, = Q (on dit 


k=1 
que les À, forment un système complet d'événements). Pour tout événe- 
ment B, on a alors : P(4;|B) = AUS RE RGE pour v = il, 2, 


Ÿ P(B]A;)- P(4) 
en 
En effet, on sait que : 
p(AB) = LAINE) L P(BIA)- PA) 
| P(B) P(B) 


et d’autre part que B= BnRQ=8BN Ua, - Ü&nay 


1. Le révérend Thomas Bayes (1701-1761) est l’auteur de An Essay Towards Solving a Pro- 
blem in the Doctrine of Chances qui ne fut publié qu’en 1763, après sa mort. 
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Les événements B N A, étant incompatibles deux à deux puisque les À, le 
sont, on en déduit que : 


P(B) = Y'P(BNA,)= Ÿ P(B|A;) : P(A;) 
k=1 k=1 
et la formule de Bayes est démontrée. 


On dit fréquemment que les événements À,, qui forment une partition de 
Q, sont les causes. Une autre dénomination, très courante, consiste à nommer 
probabilités a priori les valeurs P(A,), et probabilités a posteriori les valeurs 
P(A;]|B). En effet, la formule de Bayes permet d’obtenir une valeur révisée 
des probabilités des événements A; une fois connue la réalisation de 
l'événement B. 


On notera que l’application de la formule de Bayes demande l’évaluation 
des probabilités dites a priori P(A,) ainsi que des probabilités P(B|A,) de 
l’effet B connaissant chacune des causes. 


D Exemple 
Pour un système de crédit à la clientèle on distingue trois types de 
dossiers : les dossiers aboutissant en contentieux, les dossiers à difficultés 
temporaires ou légères et les dossiers sans dif ficultés de paiement. On a 
évalué sur la base d’e xpériences antérieures les proportions respecti ves 
des trois catégories à 1/5, 3/10 et 1/2. D'autre part, on dispose pour 
chaque dossier d’un score d’appréciation global du client rapporté à l’une 
des deux modalités sui vantes : élevé ou bas. Enfin, on sait que 90 % des 
dossiers en contentieux correspondaient à un score bas, que 60 Z des 
dossiers à difficultés légères correspondaient à un score bas, et que 85 % 
des dossiers sans difficultés correspondaient à un score élevé. Si on tire un 
dossier au hasard pour lequel le score est bas, quelle est la probabilité 
qu’il ait abouti en contentieux  ? (resp. qu’il n’ait donné lieu à aucune 
difficulté de paiement ? qu’il ait engendré des difficultés légères ?) 
Les trois événements À, = « aboutir en contentieux », À, = « difficultés 
légères » et A; = « aucune difficulté » forment un système complet. On 
dispose des probabilités a priori : 

P(A,) =0,2 P(A;) = 0,3 P(43) = 0,5 

ainsi que des probabilités conditionnelles pour les événements 
B = «score bas » et B = « score élevé » 


P(B]A;) = 0,9 P(B]A;) = 0,6 P(B]A;) = 0,15 
d’où : 
P(B) = P(BNA,)+P(BNA,)+P(BNA;) 


P(B]A:;) : P(A;) + P(B]A;) : P(A:) + P(B|A:) : P(A;) 
0,435 


140 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


On en déduit : 
P(ASNB) - P(BAJ: PCA) _ 09-05 
P(B) P(B) 0,435 


ainsi que : P(A;]B) = 0,414 et P(A;|B) = 0,172 


P(Ai|8) = = 0,414 


Ce calcul montre que l’information complémentaire « le dossier étudié 
correspond à un score bas » a permis une augmentation de la probabilité 
associée au de venir « contentieux » (0,414 au lieu de 0,2) et de la 
probabilité associée au de venir « difjicultés légères » (0,414 au lieu de 
0,3), et une forte diminution de la probabilité associée au de venir 
«aucune difficulté » (0,172 au lieu de 0,5). 


On nomme aussi probabilités révisées, les probabilités a posteriori P(A;|B). 


Le théorème de Bayes est à l’origine de nombreux développements for- 
mant ce qu’on a appelé la statistique bayésienne. Les domaines d’application 
sont très variés : gestion financière, prévisions, diagnostic, .… 


Cependant, son utilisation est très contestée, notamment en raison de la 
nécessité d’une évaluation a priori, subjective, de probabilités. De plus les 
« causes » À, se trouvent affectées de probabilités, ce qui peut apparaître 
paradoxal si on se réfère à la notion déterministe de causalité. Pour ceux qui 
contestent la statistique bayésienne, un phénomène est, ou n’est pas, cause 
(éventuellement partielle) d’un autre, et ne saurait donc être muni d’une pro- 
babilité sur cette causalité |. 


De nombreuses difficultés persistent autour de la notion de probabilité, et 
particulièrement celle du choix des probabilités qu’on affecte aux événe- 
ments rapportés à une épreuve aléatoire. L’analyse combinatoire et l’appro- 
che fréquentiste offrent une solution, dite «  objectiviste ». Cependant, ce 
point de vue se heurte à : 


* quelques contradictions logiques : le lien entre la probabilité et la fré- 
quence relative, qui permet d’évaluer une probabilité, est à relativiser par 
la loi faible des grands nombres ( cf. infra), donc par une probabilité ; on 
définit concrètement une probabilité en se basant sur une autre probabilité 
qui demande à être évaluée, et ainsi de suite... ; 


* quelques paradoxes : le paradoxe de Bertrand ? montre 3 solutions dis- 
ünctes, 1/4, 1/3 et 1/2 (toutes par l’approche fréquentiste) au calcul de la 
probabilité que la longueur d’une corde d’un cercle soit supérieure au côté 
du triangle équilatéral inscrit dans ce cercle  ; le paradoxe de St Peters- 


1. On ne vise pas, dans ce livre, à prendre parti pour ou contre l’optique bayésienne, mais à 
donner au lecteur des éléments simples sur les arguments en présence. Le débat n’est pas 
encore clos ! 

2. Présenté en détail, par exemple, dans le livre de G. Saporta, pages 11, op. cit. 
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bourg! montre que la notion fréquentiste de probabilité (donc 

« objective ») peut parfois demander des appréciations complémentaires 

(utilité) très subjectives ; 

* et quelques limites (comment évaluer les probabilités pour une épreuve 

qui n’est pas répétable ?). 

L'analyse bayésienne cherche à contourner ces obstacles, surtout ceux liés 
à l’approche fréquentiste, mais au prix de valeurs subjectives pour certaines 
probabilités, ainsi que de quelques difficultés mathématiques de mise en 
œuvre. 


Il. Variables aléatoires à une dimension 


À. Définitions 


Étant donné un espace probabilisé (Q, 4, P), une variable aléatoire (v.a. en 
abrégé) est une application  X définie sur l’ensemble fondamental Q et à 
valeurs réelles : 


X:Q — R 
(a) X(@) 


A tout événement élémentaire ©, l’application X associe une valeur numé- 
rique X(@) ; c’est pourquoi on précise parfois en parlant de variable aléatoire 
réelle? nommée aussi « aléa » ou « aléa numérique ». 


On observe que la terminologie utilisée peut paraître abusive, car  X est 
une application, donc une fonction de  Q dans R. Les variables aléatoires 
seront notées par des lettres majuscules telles que X, Y, Z,... pour les distin- 
guer des valeurs qu’elles sont susceptibles de prendre (ou réalisations), géné- 
ralement notées en minuscules. 


1. Jacques et Pierre jouent avec une pièce. Pierre paie à Jacques 1 € si pile sort dès le premier 
jet, 2 € si pile sort seulement au 2° jet, 4 € s’il ne sort qu’au 3° jet et ainsi de suite en doublant 
la somme payée par Pierre à Jacques à chaque jet supplémentaire où pile n’est pas sorti. On 
cherche à savoir quelle somme Jacques devrait accepter de payer à Pierre pour jouer à ce jeu 
si l’on veut qu’il soit équilibré, c’est-à-dire que leurs espoirs de gain soient égaux; le paradoxe 
de cette situation provient du fait qu’on peut montrer que le prix alors à payer par Jacques 
devrait être infini. Ce paradoxe a longuement été étudié par Daniel et Nicolas Bernoulli, puis 
par Buffon, Laplace, Poisson entre autres ; il a contribué à dégager la notion d'utilité. 

2. Il faut distinguer une variable aléatoire à laquelle est associée une loi, appelée aussi 

« distribution », de probabilité (théorique) d’une variable statistique quantitative à laquelle est 
associée une distribution statistique (observée), chapitre 1, $ ILA. 
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D Exemple 


On jette deux dés non pipés  ; l’ensemble fondamental associé à cette 
expérience aléatoire est formé de 36 événements élémentaires équipro- 
bables : 


Q=({11}; {1,2}; {2,1} ; .… ; (6,6) 
Si on s’intéresse à la somme des points marqués par les deux dés, on 
définira sur cet espace probabilisé une v a. X égale à cette somme ; 
l’ensemble de ses valeurs possibles est : 
{2,3,4,5,6,7,8,9,10, 11,12} 

Pour obtenir la probabilité d’une v aleur quelconque de X, il suf fit de 
dénombrer les événements élémentaires de Q qui réalisent cette valeur; 
ainsi : 

P(X =4) = P(413}L{22}04{3,1}) 


P({1,3}h) +P(4{22h +P(43,1}) = 3/36 = 1/12 


On dit que la variable aléatoire X est : 


- discrète finie si l’ensemble X(Q) est fini, discrète infinie si l’ensemble 
X(Q) est infini dénombrable, 


° continue si l’ensemble X(Q) est un intervalle de R non réduit à un point 
(ou une réunion d’intervalles de R). 


On retrouve une classification analogue à celle rencontrée pour les varia- 
bles statistiques (chapitre 1), la notion de probabilité remplaçant la notion de 
fréquence ; la loi des grands nombres ($ V) permet d’établir un lien entre ces 
deux notions. 


— Remarque 


Pour une variable aléatoire continue X, il faut compléter la définition 
en ajoutant que l’image Lu de tout intervalle ]- co, x] doit 
appartenir à la 6-algèbre 

VreR X-(J->,x]) = (we (Q|X)(w) < x) e sf 


La probabilité étant définie sur la famille des parties de Q formant 
une 6-algèbre, cette condition permet de déterminer la probabilité de 
tout intervalle de 


Notons que cette condition est générale puisqu'elle est réalisée pour 
les variables aléatoires discrètes ; pour ces variables aléatoires, l’image 
réciproque de tout intervalle de R est une partie de Q à laquelle est 
associée une probabilité. 
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B. Loi de probabilité d'une variable aléatoire 


1) Fonction de répartition d'une variable aléatoire 


La fonction de répartition F, (ou F) d’une variable aléatoire X à valeurs dans 
l'intervalle [0, 1] est définie par : F,(x) = P(X< x) 


Propriétés caractéristiques d’une fonction de répartition 
d’une variable aléatoire 


F est une fonction de répartition si : 


1. Fest croissante (au sens large) 
2° lon Fr) = 0 & in FGetî 


RES X— + co 


3. Fest continue à droite 


Compte tenu de la propriété ii) d’une probabilité ($  I.A), on peut écrire 
pour tout a, bEe R, a <b: 
F(b) = F(a) + P(a <X<b) = P(a<X<b)= F(b)-F(a) 


= la probabilité pour que X appartienne à un intervalle de R pouvant se 
calculer à partir de sa fonction de répartition F,, cette fonction caractérise la 
loi de X. 


2) Loi de probabilité d'une variable aléatoire discrète 


La fonction de répartition d’une telle v.a. est une fonction constante par inter- 
valle (ou « en escalier ») continue à droite, les points de discontinuité corres- 
pondant à des valeurs possibles de X (cf. figure 5.2) ; sa courbe représentative 
s’appelle la courbe de répartition où courbe cumulative ; on peut remarquer 
que cette fonction présente une identité formelle avec la fonction de réparti- 
tion d’une variable statistique discrète. 


Considérons le cas d’une va. X discrète finie ; ses différentes valeurs possi- 
bles, en nombre fini, sont supposées distinctes et rangées dans l’ordre croissant : 


X(Q) = the > Xi, ... »Xk} 


Connaissant la fonction de répartition de X, on peut calculer la probabilité 
p; de réalisation de toute valeur x;(1 <i<k) : 


F(x;) pour i = 1 
F(x;)- F(x;-:) pour i = 2,...,k 


p= POC= 3) = | 


Une telle distribution de probabilité peut se représenter par un diagramme 
en bâtons (cf. figure 5.3). 


144 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


Valeur de X X] js x; jé X4 k 


Probabilité Pi Le Pi de Pk i=l 


D Exemple 1 
Loi de probabilité de la v.a. discrète finie X égale à la somme des points 
marqués lors du lancer de deux dés non pipés : 


Valeur de X 2 3 4 5 6 7 8 9 10 11 12 


Probabilité Su. 


U) 
(e)) 
en" 
OO 
_ 
[ÈS] 
OI 
Si 
VU) 
[e)} 
OI 
re 
D 
_ 
OO 
VU) 
[e} 


36 


Inversement, on calcule aisément la fonction de répartition à partir de la 
connaissance des k couples (x; , p;) : 


0 Si X < X; 
F(x) = > PP, Six; <xX<X;,, pour <i<k-1) 
Î= 
1 SiX2Xy 


Lorsque la v .a.est discrète infinie , l’ensemble X(Q) est infini 
dénombrable, et on peut, comme dans le cas fini, calculer les 
probabilités de chaque v  aleur possible à partir de la fonction de 
répartition ; en sens inverse, on peut déduire la fonction de répartition de 
la connaissance des valeurs possibles et des probabilités associées. 


D Exemple 2 
Loi de probabilité de la v .a. discrète infinie X égale au nombre de jets 
nécessaires d’une pièce de monnaie non pipée pour obtenir la f ace 
« pile » : 
Valeur de X 1 2 3 as i ne e | 
DEL 
D 
Probabilité : _ L 1 LE 
2 "ui 2° 


On verra au chapitre 6 ($ IL.C) que X suit une loi géométrique de 
paramètre 0,5 
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0 1 2 3 4 5 6 7 8 9 10 11 12 x 
Figure 5.2 — Fonction de répartition (exemple 1) 


1/6 


1/12 


12 3 4 5 6 7 8 9 10 11 12 x 


Figure 5.3 — Diagramme en bâtons (exemple 1) 


3) Loi de probabilité d'une variable aléatoire continue 


Une variable aléatoire X absolument continue est une variable aléatoire dont 
la fonction de répartition F, possède en sus des trois propriétés déjà énon- 
cées, les deux propriétés suivantes : 


4. F, est une fonction continue sur tout R 
5. F, est dérivable presque partout ! 


1. C'est-à-dire que la fonction Fx peut ne pas être dérivable sur un ensemble dénombrable de 
points de R 
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Toute fonction vérifiant ces cinq propriétés peut être considérée comme 
la fonction de répartition d’une variable aléatoire absolument continue. 


La dérivée de F,, notée f,, est appelée densité de probabilité de la varia- 
ble aléatoire X. 


Une fonction f, définie sur tout KR, peut être considérée comme la densité 
de probabilité d’une variable aléatoire absolument continue si elle possède 
les trois propriétés suivantes : 


LC) 0 elR 
2. f continue presque partout ! 


3. [ro s À 


La fonction de densité est une représentation très utile de la loi de proba- 
bilité d’une variable aléatoire continue. On peut définir la loi de probabilité 
d’une variable aléatoire continue, soit par sa fonction de répartition, soit par 
sa fonction de densité, et on a la relation fondamentale suivante 


VreR F(x) = [ro 


La probabilité relative à un intervalle se calcule à l’aide de la fonction de 
répartition ou de la fonction de densité ( cf. figure 5.4) : 


b 
P(a<X<b) = F(b)-F(a) = [Ga 


a 


P(@a<X<b)=F{b)-F(e) 


a b x 
Figure 5.4 — Représentation de la probabilité d'un intervalle 


1. C'est-à-dire que la fonction f peut ne pas être continue sur un ensemble dénombrable de 
points de R : on dit encore que f est continue par morceaux ; mentionnons que les points de 
non-dérivabilité de F correspondent aux points de discontinuité de f 
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Probabilité attachée à un point x 
Soient deux nombres réels a et b positifs : 


O<P(X=x)<P(x-a<X<x+b)= F(x+b)-F(x-a) 
- (FG+5)-F()+ {FGF (5-0) 
la fonction F étant continue : (FG+b)-FG) > 0 sib—0 


(FGF 0) 0 sia—0 


d’où: P(X = x) = 0 
= la probabilité qu’une v.a. continue X prenne une valeur donnée x est 
nulle, on dit que la loi de X est diffuse (ou continue). 


Par conséquent, pour une variable aléatoire continue : 
FOH=PX<»H=PX<x) = VabeR a<b: 


P(a<X<b) =P(a<X<b)=P(a<X<b) 


b 
= P(a < X <b) = F(b)- F(a)= [Ga 


D Exemple 
Soit la fonction f définie par : 
0 pour x<0 
1 
x) = 4 — pour O<x<I1 
f(x) . 
0 pour x>l 


Montrons que cette fonction peut être considérée comme la fonction de 
densité d’une v.a. continue : 


1.f0 20 Vre R 
2. f continue saufenx=0etx=1 


F 1. 1/2 : 
3. dx = 3 fra = | Lei 
[rc x AE x x ; 


0 
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Calculons sa fonction de répartition : 


pour x <0 F(x) = fo-ar=0 


—c 


0 1 
pourO<x<1 F(x) = Jo-dr+ ford L FA = /x 
2 jt 0 
ee 0 


0 1 x 
pour x >1 F(x) = fo - di+ [dt + Joat = | 
t 
ce 0 0 


On vérifie aisément que cette fonction  F possède les propriétés de la 
fonction de répartition d’une v.a. continuel. 
On peut calculer la probabilité de tout interv alle ou réunion d’intervalles, 
par exemple : 

P(0,16 < X < 0,25) = F(0,25) — F(0,16) = 0,5 -0,4=0,1 


C. Lo: d'une fonction de variable aléatoire 


Si E est une fonction définie sur R à valeurs dans R, l'application @ o X, 
notée Y = p(X) est une variable aléatoire dont on peut déterminer la fonc- 
tion de répartition — et donc la loi de probabilité — à partir de celle de X. 


1) Changement de variable Y = aX + b 


Les paramètres a (a Æ 0) et b sont des nombres réels. Connaissant la fonction 
de répartition de X, on peut calculer la fonction de répartition F, de la v.a. Y: 


° pour a >0: 


F;(y) = P(Y<y) = P(aX+b<y) = px <=?) _ (ce) 


1. On peut remarquer que les deux points de discontinuité de la fonction de densité { x = 0} et 
{x = 1} correspondent aux deux points de non-dérivabilité de la fonction de répartition. 
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° pour a < 0: 


F}(y) = P(Y=<y) 


(EE 


a 
1-F (=?) si X est une v.a. continue 
a 
1 - P{x € i#) si X est une v.a. discrète 
a 


Lorsque la variable aléatoire X est continue, on obtient la fonction de den- 
sité fy par dérivation de la fonction F7 


2) Autres types de fonctions 


° 6 bijective (donc monotone) 


Y croissante : F,(y) = P(Y<Yy) 


P(X£E (>) = Fx(p71(>)) 
décroissante : 


FO) = PŒYS=)) 


P(XZ "7 (y)) 


_ J1-Fx(p" (y) si Ÿ est une v.a. continue 
1—-P(X<@!(y)) si X est une v.a. discrète 


Si À est une v.a. continue et si la fonction est dérivable, on obtient la 
fonction de densité fy par dérivation de la fonction F} 


D Exemple 


Soit une v.a. continue X, on peut calculer les fonctions de répartition et 
de densité de Y = exp(X), la fonction exponentielle étant croissante : 


0 our £0 Û our £<0 
Fi = P : GIE] : ” 

Fx(ny) pour y>0 7x (7) pour y>0 
° p quelconque 


Le principe consiste toujours à identifier la fonction de répartition F} en 
recherchant l’antécédent pour X de l’événement { Y < y = p(x)}. 


Par exemple, pour Y = X2: 
0 siy<0 


Fy) = 
" CE siyZ0 
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IE. Couple de variables aléatoires 


A. Fonction de répartition d'un couple aléatoire 
Soient deux variables aléatoires X et Y définies sur le même espace probabi- 


lisé (Q, SP) ;on appele joncHion de répartition du couple aléatoire (X,Y) , 
la fonction F définie sur [K? par : 


Vx,yeR? F(x,7y)= P(X<HN(<)) 


Caractérisation d’une fonction de répartition d’un couple aléatoire (X,Y ) 


1. F croissante par rapport à chacune des variables x et y 
2. lim F(x, y) =1 et lim F(x,y)=0 


X — +oo NEC 
Y — +00 y — 0 
3. Continuité à droite : lim F(x, y) = F(x, yo) 
1e; es 
; 
Y—Y0 


B. Loi d'un couple aléatoire discret 


Les variables aléatoires discrètes finies  X et Y sont définies sur le même 
espace probabilisé ( Q,%4,P). Leurs valeurs, supposées distinctes, sont ran- 
gées dans l’ordre croissant : 


X(Q) = {x , 25, , xx Pet Y(Q)= {y1,..,7;,.., y} 


La loi du couple aléatoire ( X,Ÿ) est définie par les probabilités  p;; asso- 
ciées à tout couple de valeurs possibles ( x;, y;) (cf. tableau 5.1) : 


D: 
Pÿ=P(X = x;,Y = y;) LL > Pÿ=l 
1 


j=li= 
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Tableau 5.1 -Distribution de probabilité d'un couple aléatoire (X,Y) 


Valeur de Y 
Loi marginale 
Yi suis y; ss VI de X 
Valeur de X 
# pu ss Pi; A pu Pe 
x; Pi sé Piÿ Se Pi Pie 
ie Pi es Pi sde Pu ps 
Loi marginale 
de Y Pel Fe Poj si Dei 1 


On notera l’analogie du tableau 5.1 avec le tableau d’une distribution con- 
jointe en statistique descriptive (chapitre 3, $ LA). 


l 
On a : pi = D py = P(X=x;) 


je 


k 
ps = D pi = P(X=x;) 
i=1 
Les couples (x;, p,, ) constituent la loi marginale de X et les couples 
Op Pej) constituent la loi marginale de Y. 
Si la probabilité que X prenne la valeur x; n’est pas nulle (p,, # 0), on peut 
calculer la probabilité conditionnelle Pjii de Y= y; sachant que X = x; : 


Pj/i — P(Y =7y;|X = x;) = : 


Les couples (y;, p;;) constituent la loi conditionnelle de Y liée par X = x; 
On note cette v.a. { Y|X = x; }, et on présente sa distribution comme celle de 
toute v.a. à une dimension : 


Valeur de Y Yi He y; sas Y l 
PY= 2 Pie! 
Œ=y}X= x) Pin +. Pr su.  Pui ei 


Il y a k lois conditionnelles de Y sachant que X prend une valeur donnée. 


De même, si la probabilité p.; n’est pas nulle : 


Pi/j = P(X = x;|Y = y;) 5 à 
ji 
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Les couples (x;, p;; ) constituent la loi conditionnelle de X liée par Y= y;: 
{YIX YF 
Il y a / lois conditionnelles de X sachant que Y prend une valeur donnée. 
Les deux formules précédentes entraînent ! : 
Pi = Pis Pjsi — PDP; Pi; 
Indépendance 


Les variables aléatoires X et Y sont indépendantes si pour tout couple 
(x;, y;), on a la relation : 


P(X=x)N(Œ=y)= P(X=x):P(Y = y) 
X et Y indépendantes &<  p;; = p.:p.; pour tout couple (1, j) 


En cas d’indépendance, les lois conditionnelles sont égales à la loi mar- 
ginale correspondante : 
e Pi = Pi = 
Pi = = PDP À Pyj = — = pe: 
Pre Pej 
ce qui signifie que la connaissance de la valeur prise par X n’apporte aucune 
information sur la valeur de Y, et inversement. 


La loi de probabilité d’un couple aléatoire (X,Y) permet de calculer les lois 
marginales des deux variables X et Y. En revanche, la connaissance de ces 
lois ne permet pas de déterminer la loi conjointe, sauf si les variables X et Y 
sont indépendantes. 


Mentionnons l’analogie existant entre les notions de lois de probabilité 
marginales et conditionnelles définies pour un couple aléatoire et celles de 
distributions marginales et conditionnelles rencontrées en statistique descrip- 
tive (chapitre 3). 


Toutes les notions développées pour les couples de variables aléatoires dis- 
crètes finies peuvent être généralisées à des variables aléatoires discrètes infinies. 


La loi de probabilité d’un couple aléatoire discret peut aussi être définie 
par sa fonction de répartition. 


Pour {xS<x<xiu} et {y;<y<y}: 
j i 
F(x,y) = P(XSHNESy) = NY pm 


n=lm=l 


Î 


1. Les probabilités conditionnelles p;; et p;; sont aussi parfois notées P; et p; 


MODÈLE PROBABILISTE ET VARIABLE ALÉATOIRE e 153 


C. Loi d'un couple de variables aléatoires continues 


La fonction de répartition d’un couple (X,Y) de variables aléatoires continues pos- 
sède en sus des trois propriétés déjà énoncées, les deux propriétés suivantes 


4. F est une fonction continue sur [R2 
5. Fest dérivable presque partout 


Toute fonction vérifiant les cinq propriétés peut être considérée comme la 
fonction de répartition d’un couple de variables aléatoires continues. 
d2F 
dxdy 
La loi de probabilité d’un couple de variables aléatoires continues peut 


être définie, soit par la fonction de répartition, soit par la fonction de densité, 
et on a la relation fondamentale suivante : 


La densité f du couple (X, Y) est donnée par : f(x , y) = (x , y) 


y 


Vx,y)e R2 F(x,7y) = J [ fu» v)dudv 


—co  —c 


La probabilité relative à un sous-ensemble de R° du type[a;b]X{c; dl] 
est égale à : 


{x Yjefa;b]Xxfc; 1) _ j [fu , v)dudv 


€ 


Plus généralement, la probabilité que 
le couple aléatoire ( X,Y) appartienne 
à un « domaine » Ÿ € IR? est égale à : 


Pa Yje a} L Ï [76 , Y)dxdv 


Les densités marginales g de X et h de Y sont respectivement : 


eQ) = [dy et kG)= [FG nd 


D Exemple 
Un couple (X, Y) de variables aléatoires continues suit une loi uniforme 
sur [0 ; 1]X[0 ; 1] si sa densité de probabilité est la suivante : 

O0  pourtout (x,y)æé[0;1]x[0;1] 


F(Xx, = 
Ce É pourtout (x,y)e[0;1]Xx[0;1] 
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Connaissant la fonction de densité, on peut calculer la probabilité de 
tout sous-ensemble de R° : 
0,8 0,3 
P{(x< 03)N(0,1<Y< 0,8) = J Ï 1: dxdy = 021 
01 0 
Considérons le domaine ® de [R° ainsi défini : 
D=tx.ype R2}x>0,y>0 etx+y<l}, 


1 1-u 


alors P{X,YE 31=T Ï 1 - dudv = 0,5 
0 © 


Le lecteur peut vérifier que les 
lois marginales de X et Y sont des 
lois uniformes continues sur 

[0 ; 1] — (chapitre 7, $L.A). 


Indépendance 


Les variables aléatoires X et Y sont indépendantes si et seulement si 
V(x,y)e R°: 
SG, y) = 80) : AG) 


Plus généralement, un n-uplet de variables aléatoires ( X,, X,,..., X,) de 
densité de probabilité f est un n-uplet de variables aléatoires indépendantes si 
et seulement si la densité f du n-uplet est le produit des n densités marginales f, : 


Fixe, x) = fi (i): 200). 


IV. Indicateurs des variables aléatoires 


Une différence entre la statistique descriptive et la théorie des probabilités 
réside dans le fait que la première discipline vise à représenter les données 
de façon à les rendre plus « lisibles », tandis que la seconde a pour objectif 
de fournir des modèles adaptés au traitement mathématique, donc abstraits, 
qui se veulent des images, à la fois idéales et approchées de ces données. 


L'utilisation simultanée de ces deux démarches doit permettre de faire 
apparaître les lois susceptibles de régir les phénomènes dont proviennent les 
données, puis de les exprimer de manière plus précise et maniable grâce au 
formalisme mathématique qui en dégage les propriétés essentielles. 
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Il est naturel, comme on l’a fait en statistique descriptive, de définir et d’étu- 
dier des indicateurs (ou caractéristiques) des variables aléatoires. La motivation 
est la même : la loi de probabilité constitue une grande quantité d’informations, 
et est souvent trop riche pour être appréhendée dans sa globabilité. Il est donc 
utile d’en résumer certains aspects (les mêmes que ceux envisagés en statisti- 
que descriptive) par des valeurs numériques convenablement choisies. 


Des indicateurs relatifs aux trois aspects principaux des lois de probabilité 
sont définis, à savoir : 


e la tendance centrale ; 
° la dispersion ; 
* la forme (asymétrie et aplatissement). 


Les outils mathématiques qui interviennent dans la définition de ces indi- 
cateurs varient d’un type de loi à l’autre. Les lois discrètes finies utilisent les 
mêmes outils que ceux nécessaires à la définition des indicateurs des varia- 
bles statistiques. Pour les lois discrètes infinies, quelques connaissances sur 
les séries numériques (et parfois sur les séries entières) sont utiles. Pour les 
lois absolument continues, des notions sur l’intégration sont utilisées. Cepen- 
dant, la signification de ces indicateurs ne dépend pas du type de loi de pro- 
babilité considérée, ni des techniques mathématiques utilisées. 


A. Mode 


Le mode d’une variable aléatoire est la valeur pour laquelle le diagramme en 
bâtons ou la courbe de densité présente son maximum. On appelle mode rela- 
tif une valeur correspondant à un maximum local du diagramme en bâtons 
ou de la courbe de densité, mais en général, le mode est unique. Le mode est 
un indicateur de tendance centrale. 


B. Espérance mathématique 


L’espérance mathématique d’une variable aléatoire X est aussi appelée 
« moyenne » ou « valeur moyenne » de X. Elle est généralement notée m. 


1) Cas discret 


Soit X une variable aléatoire discrète finie : 


Valeur de X Xp + Ru nn. fn Xe 


Probabilité Pr Pi Pk 
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On appelle espérance mathématique où moyenne E(X) de X : 


k 
E(X) = D xp 


i=1 


À titre d'illustration, le lecteur peut vérifier que la v.a. de l'exemple 1 du 
$ ILB a une moyenne égale à 7. On peut remarquer la similitude des défini- 
tions de l’espérance mathématique et de la moyenne arithmétique d’une 
variable statistique discrète. On a remplacé dans la formulation de cette der- 
nière les fréquences par les probabilités. 


L’espérance mathématique est un nombre réel, mais souvent, pour une 
variable aléatoire discrète, sa valeur ne correspond pas à une des valeurs pos- 
sibles de cette variable aléatoire. 


D Exemple 
Une loterie comporte 1 000 billets et un seul lot de 10 000 €. Si tous les 
billets ont été v endus et si le tirage se f ait « au hasard », l’espérance 
mathématique de la valeur V d’un billet sera : 


E(V) = 10000 .—1_ 0.2 


-——— = 10 € 
1 000 1 000 


Mais, en f ait, aucun billet ne rapporte 10  <€ : chacun rapporte 0 <€ ou 
10 000 €. Cependant, si on achète un billet à chaque tirage de cette 
loterie (en supposant qu’elle ait lieu régulièrement dans les mêmes 
conditions), la moyenne des gains sera « voisine » de 10 € au bout d’un 
grand nombre de tirages ; ce résultat qui f ait l’importance du concept 
d’espérance mathématique se réfère à la loi des grands nombres ($ V). 


La moyenne d’une variable aléatoire X a ainsi la signification d’un indi- 
cateur de « tendance centrale » de X. 


Dans le cas d’une variable aléatoire X discrète infinie : E(X) = D x P; 
i=l 
sous réserve que la série de terme général x; p; soit absolument convergente!, 
sinon, et même si elle est simplement convergente, on dira que la v.a. X n’a 
pas d’espérance mathématique. 


eo +oo +00 
1. La série Ÿ x;p; est absolument convergente si la série  Y |x;p] = Y [xp] est 
i=1 i=l i=1 


convergente. 
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L’espérance mathématique de la v.a. discrète conditionnelle { Y]|X = x;}, 
définie au $ HI.B. — est appelée espérance conditionnelle de Y sachant que 
X = x, Elle a pour expression : 


EX{YIX = x;} = D Pin 
k 
De même : E{X|Y = y;} = D XPi, 


2) Cas continu 


La variable aléatoire X étant continue de densité  f, on appelle espérance 
mathématique E(X) de X : 


+00 
E(X) = Ï x f(x) dx 
Cette définition suppose l’intégrale du second membre absolument con- 
vergentel, sinon — et même si elle est simplement convergente, on dira que 
la v.a. X n’a pas d'espérance mathématique. 


—> Remarque 


L’espérance mathématique d’une variable certaine X, c’est-à-dire une 
v.a. ne prenant qu’une seule valeur, notée b, avec la probabilité 1, est 
égale à cette valeur : E(b) = b. Notons qu’une telle variable ne mérite 
pas exactement le nom de variable aléatoire puisqu'elle peut être iden- 
üifiée à la constante b. 


On appelle variable aléatoire centrée une variable aléatoire dont 
l’espérance mathématique est nulle. 


3) Propriétés de l'espérance mathématique 


1. Si a et b sont deux nombres réels : E(aX + b) = a E(X) + b 


= si une v.a. X possède une espérance mathématique m, alors la variable 
aléatoire Y = X — m est la variable aléatoire centrée associée à X. 


+00 +00 
1. L'intégrale J x f(x) dx est absolument convergente si l’intégrale Ï lx| f(x) dx est 


—co 


convergente. 
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2. Soit @ une fonction définie sur R à valeurs dans R, alors si X est une v.a., 
(X) est une v.a. ($ IL.C) dont on peut calculer l’espérance sans avoir à déter- 
miner sa loi. 


Cas discret 
E(@(X)) = D px) p; en supposant toujours que la série du second mem- 


i 


bre est absolument convergente. En particulier : 
E(X?) = D xp 
i 
Cas continu 


E(@(X)) = [FETE dx en supposant toujours l’intégrale du second 


membre absolument convergente. En particulier : 
E(X?) = ferc dx 
R 


3. L’espérance d’une somme de variables aléatoires est égale à la somme des 
espérances : 


E(X + Y) = E(X) + E(P) 
1 conséquence : 
E(X - Y) = E(X) + E(- Y) = E(X) - E(Y) 
2de conséquence : 


Soient ñ variables aléatoires X,, X,,..., X, ayant la même espérance mathé- 
matique m. L’espérance de leur somme est égale à : 


D X - D E(X;) = 
i=1 i=1 
si on désigne par X leur moyenne : X = : y X;, on obtient : E( X) = 
is 
4. Espérance d’un produit de variables aléatoires 
Cas discret 


Soit (X, Ÿ) un couple de v.a. discrètes, on a, si la série du second membre 
est absolument convergente : 


E(X-Y) = D xp; 
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Cas continu 


Soit (X, Ÿ) un couple de v.a. continues, on a, si l’intégrale du second mem- 
bre est absolument convergente : 


E(X:Y) = [ay f(x») dxdy 
R2 
Si X et Y sont indépendantes, de la propriété { Pi = Ps Pi OÙ 


fx,y) = gx) + A(y)}, on déduit E(X + Y) = E(X) -+ E(Y), mais la réciproque n’est 
pas vraie : 


X et Y indépendantes EX:M=E(X): EM 
= 


C. Variance 


La variance d’une variable aléatoire X est l’espérance mathématique du carré 
de la v.a. centrée associée à X (si elle existe) : 


var(X) = E(X -m)? 
La variance est un nombre positif ou nul  ; sa racine carrée, notée 6, est 
appelée écart-type| : 
6 = ./var(X) 


L’écart-type d’une v.a. X, exprimé dans les mêmes unités que la variable 
X, a la signification d’un indicateur de « dispersion » autour de la moyenne 
m de X. Illustrons cette idée par un exemple. Soient les variables aléatoires 
Xet Y: 


Valeur de X | 2 4 8 E(X) = 4 Valeur de Y | —-6 2 30 E(Y) = 4 


oy= 148 


Probabilité ; Ox = V6 Probabilité 


Di 
Ri- 
HDI 
Di 
Si 


Ces deux variables aléatoires ont même espérance. Cette grandeur typi- 
que ne permet pas de les distinguer. Cet exemple montre bien que l’écart- 
type d’une variable aléatoire est un indicateur de dispersion autour de sa 
moyenne. 


1. Les calculs de la moyenne et de l’écart-type des v.a. discrètes finies peuvent se faire avec 
des calculatrices possédant les fonctions statistiques, les fréquences étant remplacées par les 
probabilités. 
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Propriétés de la variance 


1. var(N) est la valeur minimale de E[(X = ny): car on montre que : 


2 


f(x ; >) = var(X) + (ECO - b) 


De cette formule, on déduit : 
° {var(N) =0 & X est une variable certaine } 
2 


e la relation usuelle : var(X) = E(X?) - (EG) 
2. À l’aide de cette dernière expression de la variance, on montre sans 
difficulté : 
Vaetbe R, var(aX +b) = a? var(X) =6,,., = laloy, 


3. La variance d’une somme de deux variables aléatoires indépendantes 
X et Y est égale à la somme des variances : 


var(X + Ÿ) = var(X) + var(Ÿ) 

En GE à 
var(X +Y) = E((X+Y -E(X+Y))?) 
= E(X-E(X)+(Y-E(Y))? 

ECPECO) EP E(CCE(C))) 
PC ECM)" E 09) 
var(X)+var(Y)+2E(X-E(X))(Y -E(Y)) 
pour deux variables indépendantes, le dernier terme est nul 
=> var(X + Ÿ) = var(X) + var(Y) 
1re conséquence 
X et Y indépendantes = var(X — Y) = var(X) + var(- Y) = var(X) + var(Y) 
2de conséquence 


Soient n variables aléatoires X,, X,,... ,X, mutuellement indépendantes 
et de même variance 62, la variance de leur somme est égale à no2: 


a[Èx) = D var(X;) = no? 


i= 1 i=1 


Si on désigne par X leur moyenne : X = IS x ;, On obtient : 
n 


i=1 


_ 2 
VAT = 
n 
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Une variable aléatoire réduite est une variable aléatoire dont l’écart-type 
est égal à 1. Si X a une moyenne m" et un écart-type ©, on peut lui associer 
une variable aléatoire Y centrée réduite : 

__X-m 
6 


Y 


D. Corine de deux variables aléatoires, 
coefficient de corrélation linéaire 


On appelle covariance d’un couple de variables aléatoires X et Y la quantité : 
COV(X, Y) = E{(X-E(X))(Y -E(Y)); = E(XY)-E(X): E(Y) 
= var(X + Ÿ) = var(X) + var(Ÿ) + 2cov(X, Y) 


On déduit de la propriété 4 de l’espérance mathématique : 


X et Y indépendantes sn cov(X, Ÿ) = 0 
= 


Propriétés de la covariance 


1. cov(X, }) = cov(Y, X) 
2. cov(X, X) = var(X) 
3. Va, b, cetde R : 
cov(aX + b, cY + d) = ac : cov(X, }) 
= var(aX +bY +c) = a?var(X) + b?var(Y) + 2ab : cov(X, Y) 
4. [cov(X, Y)|< J/var(X) - var(Ÿ), cette inégalité est une conséquence 
de l’inégalité de Schwarz. 
On appelle coefficient de corrélation linéaire entre X et Y le rapport : 
_ Cov(X, F) 
OO 


Des propriétés de la covariance, on déduit que le coefficient de corrélation 
linéaire est invariant par changement d’origine et d'échelle et qu’il est com- 
pris entre — 1 et + 1. On peut montrer qu’il est égal à + 1 si et seulement si X 
et Y sont liées par une relation linéaire. D’autre part, si X et Y sont indépen- 
dantes, leur coefficient de corrélation linéaire est nul, mais la réciproque n’est 
pas vraie. On retrouve l’analogie de ce coefficient  p avec le coefficient de 
corrélation linéaire r défini entre deux variables statistiques au chapitre 3, $ ILA. 
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E, Moment, fonction génératrice des moments 


1) Moment 


On appelle moment m, d'ordre k (k entier positif) d’une variable aléatoire X 
l’espérance mathématique de Xf si elle existe : 


my, = E(X®) 
L’espérance mathématique n’est autre que le moment d’ordre 1. 


On appelle moment centré LU, d’ordre k (k entier positif) d’une variable 
aléatoire X l’espérance mathématique de ( X — E(X)}*, si elle existe : 


k 


y = E[X-E(X)) 


La variance n’est autre que le moment centré d’ordre 2 ; le moment centré 
d'ordre 1 est toujours nul. 


2) Moment factoriel 


On appelle moment factoriel |, d’ordre k (k entier positif) d’une variable 
aléatoire X l’espérance mathématique de X(X -1)....(X -Kk+ 1) —si elle 
existe : 


Le moment factoriel d’ordre k est une combinaison linéaire des moments 
non centrés M , M,..., My 


Relations entre moments et moments factoriels jusqu’à l’ordre 4: 


Mig = Mi m, = Lu 

SL a) #27 Math 

Bisy = M3 3m + 2m; M3 = LU] + 3Up + Lu 

Huy = #4 6m3+ 11m, — 6m: ma = Lay + 6bis+ TU lb 


3) Fonction génératrice des moments 


La fonction génératrice des moments va être présentée en se restreignant à 
une variable aléatoire discrète à valeurs possibles entières non négatives. 
Cette fonction caractérise la loi d’une variable aléatoire, et elle permet de 
plus d’obtenir les moments factoriels par dérivation. 
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On appelle fonction génératrice g, des moments d’une variable aléatoire 
X discrète, à valeurs possibles entières non négatives, l’espérance mathéma- 
tique de u*, u étant compris entre 0 et +1 : 


+oo 
gx(u) = E(u*) = Sup, pour O0<u<l 
i=0 


Propriétés de la fonction génératrice des moments 


1. Pour 0 <u<1, la fonction g, est continue, car la série qui la définit 
est uniformément convergente en u : 


+00 +00 
gx(u) = D'uipi< DN2 = | 
i=0 


i=0 
2. g,(0)=0 et g,(1)=1 
3. Si le moment factoriel d’ordre k de X existe, on montre que pour w 
compris entre O et 1: 


en notant g{ la dérivée d’ordre k de la fonction gy 


Cette propriété de la fonction génératrice est utilisée pour le calcul des 
moments factoriels qui permettent de calculer les moments non centrés, puis 
centrés. 


F, Indicateurs de forme 


Ces indicateurs donnent des informations sur la forme de la loi de  X,eten 
particulier, ils la comparent à la loi normale (chapitre 7, $ IL.B). Ils sont direc- 
tement inspirés des coefficients d’asymétrie (en anglais skewness) et d’apla- 
tissement (kurtosis) définis en statistique descriptive. 


Fisher a défini les coefficients d’asymétrie et d’aplatissement d’une varia- 
ble aléatoire X, dont les premiers moments existent, par : 


* coefficient d’asymétrie Y;, = 
D 
° coefficient d’aplatissement y; = = =3 
H 


Les moments centrés d’ordre impair étant nuls pour une distribution 
symétrique, y, est nul si la distribution de X est symétrique par rapport à la 
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moyenne m, mais la réciproque n’est pas vraie : y, peut être nul sans que la 
loi de X soit symétrique. Si la distribution de X est unimodale étalée vers la 
droite, y, est positif. Dans le cas contraire, y, est négatif. 

Le coefficient d’aplatissement y, est nul pour une variable distribuée selon 
une loi normale, mais là encore, la réciproque n’est pas vraie. Selon que la 
loi de X est plus ou moins aplatie que la loi normale, y, sera positif ou négatif. 
Plus que l’aplatissement, ce coefficient mesure l’importance des « queues » 
d’une distribution. 


Ces coefficients 7, et y, sont invariants par changement d’origine et 
d’échelle. 


G 0 Quantiles 


Comme pour les variables statistiques, on définit pour les variables aléatoires 
les quantiles, encore appelés fractiles, qui sont indicateurs de position à partir 
desquels on peut définir des indicateurs de tendance centrale et de dispersion. 


On appelle quantile d'ordre & (0 << 1) d’une variable aléatoire X de fonc- 
tion de répartition F toute valeur x, telle que : FX) =a(e P(X<£X,,) = ©) 


Notons que si F est continue et strictement croissante, le quantile x,, pour 
o donné, existe et est unique. Si F n’est pas continue et strictement crois- 
sante, il peut ne pas exister ou il peut y avoir plusieurs solutions possibles. 


La médiane Me d’une v.a. X est le quantile d’ordre 1/2 : Me = x;; 


Le premier quartile , noté OQ,, est le quantile d’ordre 1/4. Le troisième 
quartile, noté Q,, est le quantile d’ordre 3/4. La médiane est le second quar- 
tile. On définit aussi les déciles : le ième décile D; est le quantile d’ordre à /10 
(<i<oO). 


Comme en statistique descriptive, on peut définir plusieurs indicateurs à 
partir des quantiles : 


* des indicateurs de tendance centrale comme par exemple, la médiane 
Me ou encore le milieu de l'intervalle interquartile : 


(O1 + 0) 


° des indicateurs de dispersion comme, par exemple, l’étendue interquar- 
tile (Q3 — Q,) ou l’espérance mathématique des écarts absolus à la médiane 


EIX-Mel (= min EIX -b|) 


* des indicateurs de forme comme, par exemple : 


0;+0;-20; 
0;-0Q, 
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Ce coefficient, compris entre —- 1et+ 1, est nul pour une distribution 
symétrique, positif pour une distribution unimodale étalée vers la droite, et 
négatif dans le cas contraire. 


V. Convergence des variables aléatoires réelles 


Les variables aléatoires réelles sont des applications de l’ensemble fonda- 
mental Q dans KR. Dans certains cas, il est utile (voire nécessaire) de consi- 
dérer des suites de v.a. correspondant à des suites d’épreuves aléatoires (ou 
comme on le verra aux chapitres suivants, à des suites de modèles). Pour ces 
suites, on va définir plusieurs notions de convergence, visant toutes à définir 
un comportement (ou une distribution) limite. Chacune correspond à des con- 
ditions différentes, mais bien entendu, plus ces conditions seront générales, 
moins les propriétés qui s’en déduisent seront puissantes. Nous partirons du 
mode de convergence le plus général, donc le plus faible. 


Soit (X,) une suite de v.a. réelles, de fonctions de répartition FÆ,.On 
dit qu’elle converge en loi vers la v.a. X de fonction de répartition F si 
on a : 


lim F,(x) = F(x) en tout point xe R, sauf aux points de disconti- 
n — © 


nuité de F 
: L ë . 
On écrit alors X, — X , et on parle aussi de convergence faible. 


Cette notion de convergence est particulièrement simple en pratique. En 
effet, pour des variables aléatoires { X, } et X discrètes, elle revient à : 
lim P(X, = x) = P(X = x) 
n — © 
et dans tous les autres cas, elle met en œuvre les critères classiques de con- 
vergence des fonctions. 


Pour le cas des variables aléatoires discrètes, cette notion de convergence 
est utilisée par exemple pour l’approximation d’une loi binomiale par une loi 
de Poisson (à l’aide de la formule de Stirling), ce que nous voyons au chapi- 
tre 6, $ IILE. On notera cependant qu’il est possible par la convergence en 
loi, qui ne fait intervenir que les fonctions de répartition, de rechercher (et/ 
ou de poser) la convergence de v.a. discrètes vers une v.a. continue. 


D'autre part, si on suppose la convergence en loi des v.a. { X,} vers X, on 
peut approcher F, par F, et si leurs densités existent on peut approximer f, 
par f, ce qui est pratiqué dans les chapitres suivants. 
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Plus restrictive que la convergence en loi, la convergence en probabilité 
est définie ainsi : 


Une suite X,, de v.a. réelles converge en probabilité vers la v.a. X, si on a: 
lim P(IX,-X|>Ee) = 0 pour tout £ >0 


n— © 


P 
On écrit alors X, — X ou également plim X, = X 


Dans le cas de la convergence en probabilité vers une v.a. certaine, on 
peut se ramener à des conditions portant sur les deux premiers moments des 
va. X,. Pour passer au cas général de la convergence de X, vers X, on con- 
sidère alors la convergence vers 0 de la suite { X,—X1}. 


Pour le montrer, nous allons d’abord établir un résultat intermédiaire. 
Inégalité de Bienaymé-Tchébychev 


Soit Z une v.a. de moyenne li et d’écart-type 6, on a alors pour tout nom- 
bre réel K : 


1 
POZ-H>k-0)<E 


Supposant la variable Z continue, soit D l’ensemble des valeurs z de Z 
tels que |[Z-u]>Kk:06, on peut écrire, en partant de la définition de la 
variance de Z : 


o? = var(Z) = [(c-u}-f()-de> [(c-p)2. FC à 
R D 
o22[k2.02.f(2)-d = k-02: [ f(x) de = kK2.62-P(IZ-u|>k-0) 
D D 


et l’inégalité s’en déduit. La démonstration pour une v.a. discrète, identique 
dans son principe, est laissée au lecteur. 


Appliquons maintenant ce résultat dans le contexte de la convergence en 
probabilité d’une suite de v.a. Z, vers 0. En posant alors k: 6 = E, l’inégalité 
de Bienaymé-Tchebychev s’écrit : 


P(Z, EL)> e) 2 12020) 
e2 
On voit par conséquent que si la suite des moyennes Æ(Z,) converge vers 


0, et si la suite des variances var( Z,) converge aussi vers 0, alors on a : 
lim P(IZ,|>E) = 0 


n— 


ce qui montre que la suite de v.a. { Z,} converge en probabilité vers la v.a. 
certaine 0. 
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Il suffit alors de prendre {Z, = X, - a} pour voir que si la suite des moyen- 
nes E(X,) converge vers a et la suite des variances var( X,) converge vers 0, 
alors la suite des v.a. { X,} converge en probabilité vers a. 


Une suite de v.a. dont la suite des moyennes converge vers une limite a 
et dont la suite des variances converge vers 0, converge en probabilité versa. 


On notera cependant que ce dernier résultat n’est pas équivalent à la défi- 
nition, et que l’on peut parler de convergence en probabilité sans supposer 
l'existence des moments d’ordre 1 et 2. 


On peut montrer que la convergence en probabilité implique la conver- 
gence en loi, mais que la réciproque n’est pas exacte. 


Le troisième mode de convergence que nous présenterons, la convergence 
en moyenne quadratique, est très utilisé dans les problèmes d’estimation sta- 
tistique. 


Soit X, une suite de v.a. réelles de moyennes et de variances finies. On 
dit que la suite X, converge en moyenne quadratique vers X si 
tm E((X, = x}°) = à 


n — © 


Il s’agit en fait d’un cas particulier de la convergence dite en moyenne 


d’ordre p, et définie pour des v.a. X, telles que EfIx n= À j) existe, par : 


lim E[Ix, - x") = 0 
n — 
Dans la convergence en moyenne d’ordrep de la suite X, vers X, on notera 
l’hypothèse d’existence de : 
E(Ix, xl") 


On montre que si la suite X, converge en moyenne quadratique vers X, et 
que si la suite Ÿ, converge en moyenne quadratique vers Ÿ, alors la suite X,Y, 
converge en moyenne d’ordre 1 vers  XY, c’est-à-dire que la suite des 
moyennes E(X,}Y,) converge vers E(XY). Ce résultat est évidemment parti- 
culièrement intéressant dans l’étude des liaisons entre variables aléatoires. 
Plus généralement, on montre que si g(x, y) est une fonction continue en x 
et en y, et si X, (resp },) converge en probabilité vers X (resp. vers Y), alors 


g(X, , Ÿ,) converge en probabilité vers g(X, Ÿ). 


Il s’agit d’un mode de convergence fort qui implique la convergence en 
probabilité. 


D'autre part, il est important de noter que la convergence en moyenne 
d'ordre p implique la convergence en moyenne d’ordre g pour tout g < p. On 
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notera aussi que la convergence en probabilité n’implique pas la convergence 
en moyenne d’ordre 1, c’est-à-dire la convergence des moyennes. 


L’ensemble de ces trois modes de convergence est donc hiérarchiquement 
ordonné. 


Mais il existe d’autres modes de convergence, qu’il est plus difficile de 
placer dans une telle séquence hiérarchique. 


Ainsi, la convergence presque sûre est définie comme suit. 
La suite de v.a. réelles X, converge presque sûrement vers la v.a. réelle 
X si on a : 


P[ lim (X, x) = 0) = | 
n— 

Ce mode de convergence implique aussi la convergence en probabilité, 
donc également la convergence en loi. Il n’est pas lié à la convergence en 
moyenne d’ordre p, mais les deux modes de convergence peuvent cependant 
exister simultanément pour une suite de v.a. réelles X, 


Le diagramme de la figure 5.9 montre les relations que l’on peut établir 
entre les différents modes de convergence. 


D’autres modes de convergence (dont l’étude est en dehors du cadre de 
cet ouvrage) sont utilisés pour obtenir certaines propriétés en théorie des pro- 
babilités, parmi lesquelles on citera : 


— la convergence complète ; 


— la convergence uniforme presque sûre. 


Convergence 
en moyenne d'ordre p 


Convergence Convergence 
en moyenne d'ordre q <p presque sûre 


en probabilité 


y 


| Convergence en loi 


| Convergence 


Figure 5.9 — Hiérarchie des différents modes de convergence 
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L'application majeure des convergences de v.a., et particulièrement de la 
convergence en probabilité est la loi faible des grands nombres : 


Soient X; (= 1, 2,...,n) n v.a. réelles indépendantes d’espérances mm; 
et d’écarts-types o; toutes finies, telles que : 


1 < 1 € 
im =: Ÿm; = m et lim —Ÿo?=0 
nc fl ne np? 
ei er 
1 n P 
alors on à : ON oi 
n 


Soit alors une épreuve aléatoire à l’issue de laquelle un résultat À peut se pro- 
duire avec la probabilité p. On répète cette épreuve indépendamment n fois, et 
l’on désigne par F, la variable aléatoire égale à la proportion d’épreuves ayant 
donné le résultat R. Ces variables sont appelées fréquences empiriques. 

On applique directement la loi des grands nombres pour montrer la con- 
vergence en probabilité des fréquences empiriques vers la probabilitép. C’est 
le théorème de De Moivre-Laplace. 

À partir de ce résultat, toute l’approche fréquentiste des probabilités (supra, 
$ D) s’est développée sur l’évaluation de la probabilité d’un événement par la 
limite de la fréquence relative d’apparition de cet événement lorsqu’on répète 
indéfiniment l’épreuve aléatoire lors de laquelle il peut se réaliser. 

On peut aussi démontrer un résultat plus général. 


Loi forte des grands nombres 


Soient X; (i=1,2,..., n) n variables aléatoires réelles indépendantes 
d’espérances m; et d’écarts-types o; tous finis, telles que : 


1 n n 6? 
lim SJ m = m et lim — < co 
no" n — © i2 
i=1 i= 
1 ie ps 
alors on a : Din 


L’une des applications de ce résultat est la généralisation du théorème 
central-limite sous la condition de Lindeberg (chapitre 7, $ ILE). 


Au total, ce sont donc toutes les bases des applications du calcul des pro- 
babilités en statistique classique qui reposent sur ces deux résultats, loi faible 
et loi forte des grands nombres, donc sur les différentes notions de conver- 
gence des suites de variables aléatoires. 
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Testez-Vous /es réponses sont données page 286) 


Il y a au moins une réponse exacte par question. 


1. Dans l’ensemble des classes « Terminales » d’un lycée, 14 % des élèves étu- 
dient le russe, 68 % n’étudient ni le russe ni l’espagnol, 2 % étudient ces deux 
langues : 


a) 20 % des élèves étudient au moins l’espagnol 
b) 16 % des élèves étudient seulement le russe 
c) 18 % des élèves étudient seulement l’espagnol 


d) 32 % des élèves étudient le russe ou l’espagnol 


2. Soient deux événements À et B d’un même espace de probabilité tels que : 
ANnB=9 


a) PA NB)=0 
b) À et B sont deux événements incompatibles 
c) À et B sont deux événements indépendants 


d) À et B sont à la fois incompatibles et indépendants 


3. Soient deux événements À et B d’un même espace de probabilité tels que : 
P(A4)=0,3 P(B)=0,2 et P(ANB)=0,09 

a) P(A|B)= 1,50 et P(B|A ) = 0,60 

b) P(A|B )= 0,30 et P(B|A )= 0,45 

c) P(A|IB)= 0,45 et P(B|A ) = 0,30 

d) P(A|B)=0,27 et P(B|A)=0,18 

4. Soient deux événements indépendants À et B d’un même espace de probabilité 

tels que : PA) = 0,3 et P(B) = 0,2 

a) PA NB)=0,5 

b) P(A NB) = 0,06 

c) P(A LU B) = 0,06 

d) P(A L B)= 0,44 

5. Trois chasseurs visent simultanément un même lièvre et tirent en même 

temps. Soient Pi, P2,P3 les probabilités respectives de toucher le lièvre pour cha- 


que chasseur, alors la probabilité que le lièvre soit touché par au moins un des 
chasseurs : 


a) peut être inférieure à p; 

b) est égale à (p, + Pp2+p3) 

c) est égale à (1 —(1—-p,)(1 —-p2}(1 —-p3)) 

d) est comprise entre (p1: p2 : p3) et (P1 + P2 + P3) 
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6. Soient deux événements À et B d’un même espace de probabilité tels que : 
P(4)=0,6 P(B)=0,5 et PANB)=0;,1 

a) les événements À et B sont indépendants 

b) les événements À et B sont incompatibles 

c) l’événement À LU B est certain 

d) P(A|B)=0,2 

7. Si X est une variable aléatoire continue, on a, quelque soient les nombres réels a 

etb: 

a) P(X = a)=0 

b) P(a<X<b)=P(a<X<b) 

c) P(a<X<b)ZP(a<X<b) 

d) P(X > a)= 1- P(X < a) 


8. Une fonction de répartition : 

a) est une fonction strictement croissante 

b) est définie sur tout R 

c) prend ses valeurs dans l’intervalle [O0 ; 1] 


d) est toujours continue et dérivable 


9. La loi de probabilité d’une variable aléatoire : 

a) est entièrement définie par la fonction de répartition 

b) est entièrement définie par la fonction de densité 

c) est entièrement définie par l’espérance mathématique et la variance 


d) est associée à un espace probabilisé 


10. L’espérance mathématique d’une variable aléatoire réelle : 

a) est toujours égale à l’une des valeurs possibles de la variable aléatoire 
b) est un nombre réel 

c) est égale à la médiane si la distribution de probabilité est symétrique 


d) existe toujours si la variable aléatoire est discrète 


11. Soient X une variable aléatoire, a et b deux nombres réels : 
a) E(aX + b) = aE(X) + b 

b) var(- X + b) = var(X) + b 

c) P(X > E(X))= 0.5 


d\Y=aX+b = F9) =Fx(2=2) 
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12. La loi jointe des deux variables aléatoires  X et Y est donnée dans le tableau 
suivant : 


a) X et } sont indépendantes 
b) P(Y=2|X =1)=1/4 

c) P(X,Y) = +1 

d) E(Y)=1 


13. Soient deux variables aléatoires X et Y liées par la relation X -2Y = 1 : 
a) E(X) =2E(Y) +1 

b) var(X) = 2var(Ÿ) 

c) p{X,Y)=+1 

d) X et Y sont indépendantes 


14. Soient deux variables aléatoires X et Y telles que var(X) = 144, var(Ÿ) = 81 et 
var(X + YŸ) = 25 


a) cov(X, Y) = -100 
b) p{X.Y) = 0 
c) var(X — Y) = 425 


d) X et Y sont liées par une relation linéaire 


15. Soit un couple de v.a. (X, Y) pour lequel on dispose des lois conditionnelles de 
X pour chaque valeur possible de Y et de la loi marginale en Y : 


Y 
1 2 3 

X 

1 0,2 0 0,5 

2 0,8 1 0,5 

et de la loi marginale de Y: 

Valeur de Y 1 2 3 
Probabilité 0,5 0,3 0,2 


a) disposant de cette information, on peut calculer la loi du couple 
b) la distribution de la v.a. { X|Y =3} est symétrique 

c) la v.a. { X|Y =2} est certaine 

d) P(X=1)=0,7 
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16. La loi jointe des deux variables aléatoires  X et Y est donnée dans le tableau 
suivant : 


Y 
0 1 2 
X 
0 0,15 0,20 0,15 
1 0,10 0,25 0,15 


a) le coefficient d’asymétrie de la v.a. X est nul 
b) var(X) = 0,25 

c) E(Y|X =0)=1 

d) X et Y sont indépendantes 


17. La loi jointe d’un couple ( X, Ÿ) de variables aléatoires discrètes finies : 
a) est entièrement spécifiée par le tableau donnant les x;, y; et p;; 

b) est entièrement spécifiée par les k lois conditionnelles { Y|X = x;} 

c) est entièrement spécifiée par les / lois conditionnelles { X|Y = y;} 


d) est entièrement spécifiée par les espérances, variances de X et Y et leur covariance 
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Exercices (corrigés page 315) 


Exercice 5.1 


Dans un club sportif, il y a 75 adultes (dont 45 femmes) et 45 enfants (dont 25 filles). 
On interroge au hasard un adhérent du club. Quelle est la probabilité que cet adhérent : 


— soit un adulte ; 
— soit de sexe masculin ; 
— soit une femme adulte ; 


— soit un adulte ou soit de sexe féminin. 


Exercice 5.2 


Après une enquête auprès d’une population, on sait que 40 % des individus ne sont 
jamais allés en Espagne et que 55 % des individus n’ont jamais pris l’avion, mais que 
25 % ont été en Espagne et ont déjà pris l’avion. 


Quelle est la probabilité qu’un individu tiré au hasard dans cette population ne soit 
pas allé en Espagne et n’ait jamais pris l’avion ? 
Exercice 5.3 


Une enquête exhaustive sur un campus universitaire montre que sur les 32 564 étu- 
diants, 23 522 lisent la revue Notre campus publiée par l’Université, 18 859 lisent la 
revue La Vie étudiante publiée par le BDE, et 11 422 étudiants lisent Notre campus 
et La Vie étudiante. 


1. On interroge au hasard un étudiant du campus. Calculez la probabilité que cet 
étudiant : 


— ne lise ni Notre campus, ni La Vie étudiante ; 
— lise Notre campus et ne lise pas La Vie étudiante. 


2. On interroge au hasard deux étudiants du campus et on admet que leurs réponses 
sont indépendantes. Calculez la probabilité 


— que les deux étudiants ne lisent aucune des deux revues ; 


— qu'un étudiant lise les deux revues et que le second n’en lise aucune. 


Exercice 5.4 


On lance n fois une pièce de monnaie, on suppose que la probabilité d’obtenir pile 
est égale à la probabilité d’obtenir face. Soient A et B les événements suivants : 


A = « obtenir au plus une fois pile » 
B = « obtenir au moins une fois pile et au moins une fois face » 


1. Calculez P(A), P(B)et P(ANB) pour n =2; À et B sont-ils indépendants pour 
n=27? 


2. Même question pour n = 3. 


Exercice 5.5 
Calculez la probabilité qu’il y ait 3 filles et 2 garçons dans une famille de 5 enfants : 


1. Si on suppose la probabilité de naissance d’une fille égale à la probabilité de naïis- 
sance d’un garçon 


2. Si on suppose la probabilité de naissance d’une fille égale à 0,48 


176 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


Exercice 5.6 

La demande journalière X d’un bien fabriqué par une entreprise est une v.a. qui suit 

la loi suivante : P(X=0)=1/6 P(X=1)=1/6 P(X=2)=1/2 P(X=3)= 1/6. 

On suppose que le profit, fonction de la demande et du coût, vérifie la relation 

IX) = p.X — C, p étant le prix unitaire du bien fixé à 600 €, C étant le coût supposé 

indépendant de la demande et égal à 800 €. 

1. Calculez l'espérance et l’écart-type du profit. Quelle est la signification de l’espé- 
rance du profit ? 

2. Déterminez la fonction de répartition du profit et tracez son graphe. 


Exercice 5.7 


Une compagnie d’assurances admet pour l’année à venir et pour un certain type de 
contrat, que 60 % des assurés n’auront pas de sinistre. Par ailleurs on suppose que le 
coût moyen de règlement des accidents est de 500 € avec une probabilité de 0,25, de 
1 500 € avec une probabilité de 0,1, de 2 500 € avec une probabilité de 0,05. Un 
assuré déclare au plus un sinistre de ce type dans l’année. 


1. Pour espérer un bénéfice moyen de 50 <€ par assuré, quel doit être le montant de 
la cotisation ? 


2. Quelle est la probabilité pour que le coût de règlement total de deux assurés pris 
au hasard n’excède pas le montant encaissé de leurs cotisations (au tarif déterminé 
au 1) ? 


Exercice 5.8 


Dans une banque, un système de guichet automatique a été mis en place et permet de 
faire des opérations bancaires courantes : extrait de compte, remise de chèque, retrait. 
Le nombre de clients utilisant le guichet automatique dans un intervalle de temps de 
5 minutes est une v.a. X telle que : 


P(X =0)=0,3, P(X =1)=0,3 et P(X=2)=0,4 
1. Calculez E(X) et var(X). 


2. On suppose que les nombres de clients utilisant le guichet automatique sur deux 
périodes de 5 minutes ne se chevauchant pas sont indépendants. Soit  Y la v.a. 
égale au nombre de clients utilisateurs sur une période d’une heure. La v.a. Y peut 
s’écrire : 


où X; désigne le nombre de clients utilisateurs au cours de intervalle de 5 minutes 
lorsqu'on découpe l’heure en 12 intervalles de 5 minutes ; chaque X; suit la même loi 
que X. 


Quelles sont les valeurs possibles de Y ? 
Calculez E(Ÿ), var(Y) et P(Y = 0). 


3. Chaque client ne peut effectuer plus de 2 opérations au guichet automatique. La 
banque a constaté que chaque client effectue : 


3 fois sur 10 : 2 opérations 
6 fois sur 10 : 1 opération 
1 fois sur 10 : O opération (compte non approvisionné, par exemple) 


Soit Z, le nombre d’opérations effectuées dans un intervalle de temps de 
5 minutes. 
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3.1. Donnez dans un tableau à double entrée l’ensemble des probabilités condition- 
nelles de Z sachant X. 


3.2. Quelle est la loi de Z ? Calculez E(2) et var(2Z). 


Exercice 5.9 


Une usine de pellicules de photo dispose de trois machines À, B et C qui fabriquent 
respectivement 20 %, 50 % et 30 % de la production totale. Les proportions de pelli- 
cules défectueuses fabriquées par les machines À, B ou C sont respectivement égales 
à 6 %,5 Het3 %. 


On tire au hasard une pellicule dans la production, calculez : 
— la probabilité que cette pellicule soit défectueuse ; 
— la probabilité qu’elle provienne de la machine À sachant qu’elle est défectueuse ; 


— la probabilité qu’elle provienne de la machine À sachant qu’elle est non défec- 
tueuse. 


Exercice 5.10 


Un couple ( X, Y) de variables aléatoires suit la loi jointe donnée dans le tableau 
suivant : 


u, a et b étant des valeurs réelles. 


1. Pouvez-vous déterminer a et b de telle sorte que les variables aléatoires X et Y 
soient indépendantes en probabilité ? 


2. Dans ces conditions, déterminez la loi marginale de X, et les lois conditionnelles 
de X pour les différentes valeurs de Y. 


3. Si a = 1/5, existe-t-il une valeur de x telle que le coefficient de corrélation 
linéaire p (X, Y) soit nul ? Les variables aléatoires X et Y sont-elles alors indépen- 
dantes en probabilité ? 


Exercice 5.11 


Soient deux variables aléatoires X et Y : X prend les valeurs 0 et 1 avec les pro- 
babilités 1/2 et 1/2, Y prend les valeurs O0 et 2 avec les probabilités 1/3 et 2/3. On 
note : P(X=0etY =0)=p. 


1. Calculez, en fonction de p, les probabilités suivantes : 
P(X=0etY=2) P(X=1etY=0) et P(X=1etY=2) 
Entre quelles limites peut varier p ? 


2. Calculez, en fonction de p, le coefficient de corrélation linéaire p (X, Y). 
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6, Les principaux 


modèles statistiques 
discrets 


Notion de modèle 


Par modèle on entend une représentation simplifiée d'un processus, 
d'un système. 

Dans les domaines des sciences économiques et de gestion, on cherche 

à disposer de modèles pour analyser, prévoir et décider. La nature même 
des facteurs intervenant en gestion et en économie explique le caractère 
aléatoire, c'est-à-dire non déterministe, donc non contrôlable totale- 
ment du modèle qu'on cherche à définir pour représenter le système 
étudié. 

Dans la plupart des cas, on dispose d'un ensemble fragmentaire de don- 
nées à partir desquelles on cherche une représentation globale. C'est là 
une des démarches classiques en statistique, déduire des informations 
fournies par un échantillon une ou plusieurs caractéristiques concernant 
la population d'où l'on extrait l'échantillon ; il s'agit là de l'inférence sta- 
tistique. 

La construction d'un modèle est destinée donc à analyser, prévoir ou 
décider à partir d'un support rigoureux et fiable ; sa recherche est ainsi 
un travail formel. Pour l'aborder il est nécessaire de définir avec précau- 
tion tous les éléments dont on dispose : 

- la population pour laquelle le modèle est destiné ; 

- l'individu, ou unité élémentaire de la population ; 

- le caractère étudié sur chacun des individus, et qui définit le phéno- 
mène étudié ; 

- la nature de ce caractère (qualitatif, quantitatif, discret ou continu). 

À partir de là, on peut associer — par une démarche analogue à celle vue 
en statistique descriptive - une variable aléatoire à chaque individu de 
la population. C'est cette variable aléatoire et sa distribution de proba- 
bilité qui vont constituer les éléments du modèle ; on dit que cette varia- 
ble aléatoire est la variable générique de la population (on dit aussi 
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variable parente) puisque tout individu - tant qu'on ne connaît pas ses 
caractéristiques individuelles - peut être représenté par une variable 
aléatoire de même loi qu'elle. Il sera alors possible d'étudier un ensem- 
ble d'individus extrait de la population générale comme un ensemble de 
variables aléatoires ayant toutes comme loi, la loi de la variable généri- 
que de la population. Lorsque ces variables sont indépendantes entre 
elles, on dit qu'elles forment un échantillon de la variable parente ; cette 
condition d'indépendance est équivalente à un tirage avec remise des 
individus formant l'échantillon au sein de la population. 


Modèles empiriques (ou expérimentaux) 


Ce sont des modèles qui sont construits sur l'observation d'une série sta- 
tistique. Leur validité dépend tout particulièrement de la taille de la 
série statistique des observations. On recherche ici les caractéristiques 
essentielles de la série observée (moyenne, médiane, mode, quartiles, 
symétrie ou non...). Parmi les représentations en lois de probabilité con- 
nues, on en cherche une qui soit cohérente avec les données observées, 
du point de vue de ces caractéristiques. On procède par analogie. 


Modèles théoriques (ou analytiques) 


On étudie le phénomène en essayant de le décomposer en composantes 
élémentaires directement représentées et de façon naturelle par une loi 
de probabilité (telle que la loi de Bernoulli ou la loi uniforme). 

Le schéma binomial comme le schéma hypergéométrique ( infra S II.B et 
IC), ou encore la loi géométrique (8 II.D) sont des exemples de cette 
approche. 


Classification des modèles 


On doit distinguer les modèles discrets pour lesquels les diverses occu- 
rences sont ponctuelles et parfaitement bien isolées (séparées) les unes 
des autres, des modèles continus pour lesquels les occurences sont beau- 
coup trop nombreuses pour pouvoir être isolées ponctuellement et ne 
peuvent être étudiées que par classes de valeurs. À l'intérieur des modè- 
les discrets, on distingue encore les modèles discrets finis (c'est-à-dire 
dont le domaine des valeurs est de cardinal fini) des modèles discrets 
infinis dénombrables. 

Il'existe d'autres classifications mais qui concernent des modèles qui ne 
sont pas abordés dans ce cours du fait de leur plus grande complexité et 
de leur utilisation moins fréquente. 

De très nombreux modèles (discrets ou continus) ont été construits pour 
correspondre à des situations pratiques déterminées. Nous présentons 
dans ce chapitre et dans le suivant ceux qui sont le plus fréquemment 
utilisés, mais bien entendu il ne faudra pas croire que tout phénomène 
puisse être rapporté aux quelques modèles décrits ici. 
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I. Les modèles élémentaires 


A. Le schéma de Bernoulli 


Toute épreuve aléatoire n’ayant que deux résultats possibles peut être consi- 
dérée comme une situation d’alternative : si l’un des deux résultats ne se réa- 
lise pas, c’est que l’autre le sera obligatoirement. En d’autres termes, dans 
une telle situation, les deux résultats possibles sont complémentaires l’un de 
l’autre, la somme de leurs probabilités étant égale à 1. 


Il s’agit là d’une situation extrêmement fréquente puisque dès qu’on cherche 
à mettre en évidence la présence d’un caractère particulier pour les individus 
d’une population, tout individu de cette population peut être décrit selon une 
telle alternative : ou bien il présente ce caractère ou bien 1l ne le présente pas. 


Ainsi par exemple lorsqu'on cherche à évaluer l’impact d’une campagne 
publicitaire sur les achats d’un nouveau produit, on peut associer à chaque 
individu sondé (parmi ceux ayant acquis ce produit après la campagne publi- 
citaire) trois variables aléatoires : 

* la première met en évidence si l’individu possédait déjà auparavant ce produit ; 

* la seconde met en évidence si l’individu a été touché par la campagne 

publicitaire ; 

* la troisième décrit si l’acquisition du produit a été induite par la campa- 

gne publicitaire. 

Il s’agit là d’une possibilité de formalisation (et bien entendu ce n’est pas 
la seule !), mais chacune de ces trois variables correspond bien à une situa- 


tion d’alternative. L’étude des effets éventuels de cette campagne publicitaire 
met en œuvre les outils appropriés de l’analyse statistique. 


Dans ces situations de dualité, l’une des deux issues est celle que privilé- 
gie l’étude, elle correspond à la positivité d’un index, à la présence du carac- 
tère pour chaque individu de la population faisant l’objet de l’étude, par 
opposition à son absence. Les aléas qu’on peut définir dans ces cas étant des 
aléas qualitatifs, 1l faut trouver le codage le plus approprié. C’est cet aspect 
de présence/absence qui l’impose, et on code par 0 et 1 les deux issues pos- 
sibles, celle qu’on cherche à mettre en évidence étant codée 1. 

On définit ainsi une variable aléatoire qui ne peut prendre que 


deux valeurs, à savoir 0 et 1. Elle porte alors le nom de variable aléatoire de 
Bernoulli! et possède alors une loi de probabilité très simple pour laquelle p 


1. Jacques Bernoulli (1654-1705), scientifique suisse a beaucoup contribué au développement 
du calcul des probabilités (loi des grands nombres) et aux statistiques. 
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représente la probabilité de l’issue qu’on veut mettre en évidence (notation 
conventionnelle). On note souvent g = 1 — p la probabilité de l’autre terme 
de l’alternative. Le terme de variable aléatoire de Bernoulli est synonyme de 
celui de variable aléatoire indicatrice (indiquant la réalisation éventuelle de 
l’événement de probabilité p). Il faut bien se souvenir qu’une variable de 
Bernoulli est définie par les 2 valeurs 0 et 1 (et celles-là seulement  ; toute 
autre paire de valeurs ne permet plus l’appellation de variable de Bernoulli ; 
ceci se justifie comme on le verra dans la suite pour la construction des 
modèles binomial, hypergéométrique et de Pascal). Le tableau de la loi de 
probabilité d’une telle variable est parfaitement connu dès que p l’est. La loi 
de Bernoulli dépend du seul paramètre p. 


Valeur de X 0 1 


Probabilité g=1-p P 


Le diagramme en bâtons et le graphe de la fonction de répartition d’une 
variable de Bernoulli (cf. figure 6.1) sont particulièrement simples. 


Diagramme en bâtons Fonction de répartition 


Figure 6.1 — Loi de Bernoulli 


L’espérance d’une variable de Bernoulli de paramètre p est égale à p. En 
effet : 


EX)=0-(1-p)+1-p=p 
Le moment d’ordre 2 est égal aussi à p, puisque : 
EX@)=02:(1-p)+12-p=p 
Par conséquent, la variance est égale à pq: 
var(X) = EX?) - (EX) = p - p? = p(1 - p) = pq 


On remarquera au passage que la fonction x(1 — x) dont la dérivée est égale à 
(1 —2x) à un maximum pour x= 1/2, maximum égal à 1/4. Par conséquent, 
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la variance d’une variable de Bernoulli est au plus égale à 1/4, et l’écart-type 
est au plus égal à 1/2. 


En conclusion, on retiendra que toute situation aléatoire d’alternative 
peut être représentée par une variable de Bernoulli dont le paramètre p, 
égal à la probabilité de l’issue qu’on cherche à mettre en évidence, est 
égal à l’espérance, la variance étant égale à p(1 — p). 


B. L: loi uniforme discrète 


Un exemple particulier de loi de Bernoulli est celui pour lequel  p = q = 1/2. 
Dans ce cas, les deux termes de l’alternative pouvant se présenter à l’issue 
de l’épreuve aléatoire sont équiprobables. Cette situation d’équiprobabilité 
correspond souvent à des situations dans lesquelles on ne dispose d'aucune 
information permettant de mieux appréhender l'événement auquel on s’inté- 
resse. 


La loi uniforme discrète en est la généralisation. On suppose cette fois que 
l'expérience aléatoire possède k issues distinctes, possédant chacune la même 
chance d’être réalisée. On définit alors dans ce contexte une variable aléatoire 
X pouvant prendre toutes les valeurs entières comprises entre 1 et k, chacune 
de ces valeurs étant associée à l’une des k issues de l’épreuve aléatoire. On 
peut donc écrire d’une part : 


k k 
SPX=iù = PIUX=à = | 
F1 
i=1l 
et d’autre part, P(X = i) étant constante, on peut la désigner par p. 
On en déduit : 
k k 
1 = D P(X=i) = D p=k.p 
i=1 i=1l 

et la probabilité commune p est égale à 1/ k 

La loi de probabilité de cette variable aléatoire est résumée dans le tableau 
suivant : 


Valeur de X 1 2 ice k 


Probabilité 1/k 1/k ke l/k 


On déduit les caractéristiques essentielles : 


k k 
1 IS, 1 +1) _ k+l 
EG = Yi =, Yi = " 

i=l i 
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autrement dit, l’espérance de cette variable aléatoire se situe à l’exact milieu 
des valeurs possibles. Ce résultat est tout à fait naturel compte tenu de l’équi- 
probabilité. 
D'autre part : 
k 


= es Le La 2 L Hs DCE) HE DCE 
SUN CRE ES 


d’où l’expression de la variance : 


_ Œ+D(@k+1) (+1) _ k&-1 
6 4 12 


En ce qui concerne ces résultats, on notera qu’ils sont obtenus pour une 
loi uniforme discrète dont les valeurs sont les entiers compris entre 1 et k (au 
sens large). Par conséquent, ils peuvent s’appliquer à toute situation aléatoire 
à k issues équiprobables dès que celles-ci peuvent être codées par les nom- 
bres 1,2,... ,k. Si on doit adopter un autre codage, les valeurs de l’espérance 
et de la variance (comme de tout autre moment) seront modifiées puisqu'elles 
dépendent des valeurs possibles de la variable aléatoire. 


var(X) = E(X2)-[E(X)I? 


On peut encore donner la fonction génératrice des moments de cette varia- 
ble aléatoire uniforme discrète. On a : 


k 
1 
= E X\ — LS 
gx) = Eur) = Yu. 
i=1 
ce qui permet d’obtenir les moments successifs, mais aussi de retrouver les 
résultats précédents. On constate aussi par ailleurs que les moments factoriels 
d’ordre strictement supérieur à k sont nuls : u,,(X) dès que n >k 


On ajoutera simplement pour terminer que le diagramme en bâtons de 
cette loi est formé de bâtons de même hauteur, et que le graphe de la fonction 
cumulative est formé de marches d’escalier également espacées (l’espace 
entre deux d’entre elles étant de 1/ k) et de même largeur (l’unité). 


Il. Les schémas de Bernoulli itératifs 


Le schéma de Bernoulli est le plus simple des modèles probabilistes, cependant 
il est fondamental. Ceci est dû au fait que le plus grand nombre de situations 
aléatoires peuvent se décomposer en successions d’épreuves élémentaires de 
Bernoulli. On n’envisagera ici que la situation où le résultat du phénomène 
complexe initial est égal à la somme des résultats des épreuves élémentaires 
de Bernoulli. 
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Dans ce cadre, on étudiera une succession d’épreuves de Bernoulli 
— en nombre fixé, et avec indépendance = schéma binomial, 
— en nombre fixé et sans indépendance — schéma hypergéométrique, 


— en nombre aléatoire, jusqu’à ce que l’on ait obtenu pour la 1 re fois 
l'issue recherchée de l’alternative ainsi répétée — schéma géométrique, 


— en nombre aléatoire, jusqu’à ce que l’on ait obtenu pour la kème fois 
l'issue recherchée de l’alternative ainsi répétée — schéma de Pascal. 


Les deux premiers cas sont de nature totalement différente des deux der- 
niers, car le nombre des itérations du modèle élémentaire de Bernoulli est, 
pour les premiers, connu au départ, alors qu’il est la quantité aléatoire pour 
les derniers. 


A. Le schéma binomial 


Définition 


Une variable aléatoire est dite suivre une loi binomiale de paramètres 
n et p, notée B(n ; p), si elle peut être considérée comme la somme de 7 
variables aléatoires de Bernoulli, indépendantes et de même paramètre p. 


Soit par exemple, une population dans laquelle une proportion p d’individus 
présente un caractère donné. On se pose la question de savoir si un échan- 
tillon! de n individus choisis au hasard dans la population a de grandes chan- 
ces de contenir k individus ayant le caractère. 


Chaque individu de la population (et donc de l’échantillon) est présent 
dans ce problème par une alternative : il possède le caractère étudié ou non. 
Il est parfaitement justifié de lui associer une variable de Bernoulli prenant 
la valeur 1 s’il a le caractère étudié, et la valeur 0 sinon. Cette variable ainsi 
définie pour chaque individu est la variable générique de la population (ou 
encore la variable parente). Si on la note X, on a P(X = 1) = p, et donc aussi 
P(X=0)=1-p=3g. Les n individus (1, 2..., n) de l’échantillon seront ainsi 
représentés par n variables de Bernoulli X,, X,,..., X, ayant toutes la même 
loi de probabilité, celle de X, une loi de Bernoulli de paramètre p. On peut 
supposer toutes ces variables indépendantes pour la simplicité du problème, 
ce qui correspond par exemple à un tirage des n individus avec remise, ou 
bien à un taux de sondage n / N inférieur à 10 , N étant la taille de la popu- 
lation (ce point important sera revu au $ ILC avec la loi hypergéométrique). 


1. Ce terme d’échantillon se réfère à la fois au sens usuel, et également à une collection de 
variables aléatoire indépendantes et de même distribution. 
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Considérons la variable aléatoire Y, somme des n v.a. X;: 
Y=X,+X, +... + X 


Les réalisations de cette variable aléatoire étant des sommes de 0 et de 1, 
sont des nombres entiers compris entre 0 et n. 


La réalisation de la v.a Ÿ associée à un échantillon donné représente le 
nombre d’individus qui possèdent le caractère étudié dans l’échantillon . 


C’est ce type de construction par itération d’un processus de Bernoulli, le 
nombre d’itérations étant fixé et les épreuves étant indépendantes, qu’on 
appelle schéma binomial. 


La loi de probabilité de la variable somme  Y est définie par : 

— les valeurs susceptibles d’être prises, ici les valeurs entières comprises 
entre Ü et 7 

— les probabilités correspondant à ces valeurs : 


PE =D = (é)pti- pr 


En effet, à chaque groupe de k individus associés à la valeur 1 (possédant 
le caractère étudié), correspond un groupe formé de ( n — k) individus associés 
à la valeur 0. La probabilité de réalisation d’une telle situation ( k fois présence 
du caractère et (n — k) fois son absence) s’obtient en multipliant les probabilités 
associées aux réalisations des variables de Bernoulli correspondant à chaque 
individu (ces variables étant indépendantes, les événements le sont aussi) : 


prpupe ep dsp).. (en s PL 
k fois (n—k) fois 


= n! 
k!(n—k)! 
n de l’échantillon (les k premiers, les ( k — 1) premiers et le dernier, ..., les 
k derniers), donc d’obtenir une somme égale à k, chacun de ces 
« assemblages » étant incompatible avec l’un quelconque des autres 
puisqu’au moins une paire d’individus passe d’un état à l’autre. La probabi- 


lité que la somme Y prenne la valeur k, sans tenir compte du rang des  X; 


prenant la valeur 1 à condition qu’il y en ait k et k seulement, est ainsi l’addi- 


Il y a exactement () façons d’isoler k individus parmi les 


tion de () fois la probabilité p#(1 — p)"-K 


Le tableau suivant présente la loi de probabilité binomiale (n ; p) : 


Valeur de Y 0 1 2 . k …|n 


n 


JPG - pr? ….]()rfQ = py-À.. on 


Probabilité | (1 p}"|np(1 - p}'-1 ( ! 
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Les caractéristiques d’une loi binomiale (n ; p) sont très faciles à calcu- 
ler si on utilise la décomposition en somme de variables de Bernoulli indé- 
pendantes. En effet : 


E(Y) = E(X;,+X,+...+%X,) 
= E(X;)+E(X,) +... +E(X,) 
= n:E(X) 
et par conséquent : 
E(Y) = np 


Pour le calcul de la variance, la propriété d’additivité, toujours vraie pour 
l'espérance, suppose que les variables de Bernoulli X; sont indépendantes, et 
cette hypothèse est fondamentale pour la validité du résultat 


var(Y) = var(X,+X,+...+X,) 


var(X,) + var(X;,) +...+var(X,) 


n:var(X) = np(l-p) 


On obtient le résultat : 
var(Y) = npq 


On pourra comparer ce dernier résultat avec celui du $  IL.B obtenu pour 
une loi hypergéométrique, cas d’une somme de variables aléatoires de Ber- 
noulli non indépendantes. 


La propriété suivante est intéressante en pratique. 


Propriété 1 


Si Y et Z sont deux variables aléatoires indépendantes, respectivement 
distribuées selon des lois binomiales (n, ; p) et B(n, ; p), leur somme 
Y +Z suit une loi binomiale B(n, + n, ; p) 


En effet, Y étant la somme de n, variables de Bernoulli indépendantes de 
même paramètre p, et Z étant la somme de n, variables de Bernoulli indépen- 
dantes de même paramètre p, la v.a. Y + Z est la somme de (n, + n,) variables 
aléatoires de Bernoulli indépendantes de même paramètre p, et suit une loi 
binomiale (n, + n, . p). 


Une seconde propriété très utilisée est la suivante. 


Propriété 2 


Si Y suit une loi B(n ; p), alors n — Y suit une loi B(n ; 1 —-p) 
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En effet, nous avons vu que Y représente le nombre de fois, sur n indivi- 
dus, où on a observé l’un des termes de l’alternative, celui de probabilité  p. 
Il s’ensuit que (n — Y) est le nombre des autres résultats, ceux correspondant 
à une probabilité élémentaire (1 — p). Or, il serait tout à fait possible de reco- 
der les deux termes de l’alternative, en définissant une nouvelle variable de 
Bernoulli prenant la valeur 1 avec la probabilité (1 — p) et la valeur 0 avec la 
probabilité p. La somme de ces n nouvelles variables aléatoires représente de 
nombre d’épreuves (parmi les n réalisées) qui donnent le résultat de proba- 
bilité (1 — p), c’est-à-dire la variable aléatoire (  n — Y) que nous étudions. 
C’est une somme de variables aléatoires de Bernoulli, indépendantes et de 
même paramètre (1 — p). D’où le résultat annoncé. 


La construction du schéma binomial par les variables de Bernoulli justifie 
d’autre part la notation (1 ; p) adoptée parfois pour désigner un aléa de 
Bernoulli de paramètre p. 


Une variante de la loi binomiale est la loi dite  binomiale en proportion . 
On a vu qu’une loi binomiale caractérise le nombre de résultats codés 1 dans 
une succession d'épreuves de Bernoulli (dont le nombre est fixé à l’avance) 
indépendantes. Dans un certain nombre de circonstances, on s’intéresse plu- 
tôt à la proportion des résultats codés 1. Or si  Y est le nombre des résultats 
codés 1 dans une suite de n épreuves de Bernoulli indépendantes, Y/n est la 
fréquence relative où proportion. 


Lorsque Y prend une valeur quelconque k comprise entre 0 et n, Y/n prend 
la valeur K/n et réciproquement. Les deux événements équivalents { Y = k} et 
{Y/n = k/n} ont ainsi la même probabilité. La loi de  Y/n est définie par ses 
valeurs et les probabilités correspondantes : 


Valeur de Y/n 0 l/n 2/n Le kin sel il 


Probabilité n n\_k = L 
1-p} 1-p}y"-1l 2(1 — n-2| 1 = n k|_ |P 
Gp ape pv | )p2 an) (Ja - p) 


Le tableau de cette loi de probabilité se déduit de celui d’une loi binomiale 
en divisant simplement chaque valeur possible par n. 


Le diagramme en bâtons et la fonction de répartition d’une loi  %(n; p) 
dépendent des 2 paramètres n et p. Le cas particulier où p = 0,5 correspond 
à l’équiprobabilité des deux termes de l’alternative de base (présence/ 
absence) et se traduit graphiquement par une symétrie du diagramme en 
bâtons (cf. figure 6.2). 
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Diagramme Fonction 
41 en bâtons 411 de répartition 


0 1 2 3 4 5 6 0 1 2 3 4 5 6 
Figure 6.2 — Loi binomiale B(6 , 0,5) 


Les calculs relatifs aux distributions binomiales peuvent se faire à l’aide 
de tables statistiques ( cf. annexe IV). Ces tables donnent pour quelques 
valeurs de n et de p, les probabilités cumulées de telles répartitions. Le nom- 
bre des valeurs de n et de p envisagées est forcément très limité. Grâce à la 
propriété 2, on peut déduire les probabilités d’une loi  %(n ; 1 — p) de celles 
d’une loi B(n ; p). Au lieu de recourir à des interpolations linéaires (parfois 
causes d’importantes erreurs d’approximation), on utilisera plutôt la formule 
de récurrence suivante (rappelée à l’annexe Il), entre les probabilités de deux 
valeurs successives k et (k + 1) d’une distribution binomiale @(n ; p) : 


( # ATETES n! 


P(X=k+1) _ +1 _ Œ+DI&-K-DP 
P(X =) D. : n! | 
Gens Een Di0 
__G@-Dp 
(K+1)(1-p) 


Cette formule permet de calculer successivement les probabilités indivi- 
duelles, en partant de P(X=0)=(1-p}" 


D Exemple 


Après une élection à deux candidats À et B, c’est À qui l’emporte avec 
un score de 52 %. On suppose que le nombre d’électeurs qui se sont 
exprimés est élevé. 


On cherche à déterminer la probabilité qu’un sondage préélectoral 


portant sur 50 électeurs ait donné une majorité de suffrages pour B 
(c’est-à-dire un résultat à l’opposé de la réalité des intentions de vote de 
la population). 
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Ce problème doit être modélisé en définissant la population, celle des 
électeurs, puis l’individu, un électeur et le caractère étudié, le bénéfi- 
ciaire du vote : soit À, soit B (B équivalant à « non À »). 


Le caractère est un caractère qualitatif à deux modalités, et à chaque 
électeur est associée une variable de Bernoulli qui prend la valeur 1 s’il 
vote pour À et la valeur 0 sinon. La variable générique de la population 
est une variable de Bernoulli de paramètre 0,52 puisque chaque électeur 
tiré au hasard vote pour À avec une probabilité égale à la proportion de 
votants en faveur de À (cf. l’analogie entre probabilité et fréquence rela- 
tive vue au chapitre 5). 

Les 50 électeurs interrogés avant le scrutin forment un ensemble de 

50 variables de Bernoulli de même paramètre, à savoir 0,52. De plus ces 
variables sont indépendantes si le tirage est effectué avec remise ou si le 
taux de sondage est inférieur à 10 % (ce qui est supposé ici compte tenu 
de la taille de l’échantillon). 


La somme de ces 50 variables Y = X, + X, +... + X;, contient autant de 
1 que d’électeurs favorables à À, et représente le nombre d’électeurs, 
parmi les 50 sondés, favorables à A. Cette somme de variables de Ber- 
noulli suit une loi binomiale (50 ; 0,52). 
La probabilité que cet échantillon donne une majorité pour B est égale à 
la probabilité que le nombre d’électeurs favorables à À soit strictement 
inférieur à 25. 
Puisque Y représente le nombre d’électeurs favorables à À, la variable 
aléatoire (50 — Y) représente le nombre d’électeurs favorables à B. Par un 
raisonnement identique à celui fait pour Y, la variable aléatoire (50 — Y) suit 
une loi binomiale %(50 ; 0,48). Lorsque B a la majorité, on a {50—-Y >25} 
et la probabilité cherchée vaut : 

PY <25)=P(50-Y>25)=1-P(50-Y<25) 
Le calcul (programme ou table) donne P(50 — Y < 25) = 0,6648 pour la 
loi %(50 ; 0,48), et il y a donc près de 33,5 % de chances qu’un échan- 
üllon de 50 personnes donne un résultat contraire à la réalité ! Ceci est 
dû à la conjonction de deux éléments : 


° Le résultat final est assez « serré » car les deux termes de l’alternative 
sont très peu séparés en probabilité (0,52 contre 0,48) ce qui signifie que 
si l’échantillon était l’exact reflet de la population, on aurait 26 contre 
24, soit 2 voix de différence seulement ; 

° on n’interroge que 50 personnes, et cela est bien peu, compte tenu des 
scores réels, pour discriminer les 2 candidats de manière fiable (donc 
crédible). 

On notera enfin sur cet exemple que si le nombre de votants favorable à 
A suit une loi binomiale %(50 ; 0,52), la proportion de votants favora- 
bles à À suit une loi binomiale en proportion. 
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B. Le schéma hypergéométrique 


Dans le schéma binomial, on répète une épreuve de Bernoulli n fois, mais de 
telle façon que les épreuves soient indépendantes. 


Cette condition peut paraître peu réaliste. En pratique lorsqu'on tire un 
échantillon de taille n dans une population de taille N(n < N), le bon sens veut 
qu’on ne prenne pas 2 fois le même individu, ce qui équivaut à tirer l’échan- 
tillon sans remise (on parle encore de tirage exhaustif). Les variables aléa- 
toires de Bernoulli associées aux différents éléments de l’échantillon, et 
indicatrices de la présence ou de l’absence d’un caractère donné, sont, du fait 
du tirage sans remise, mutuellement dépendantes. 


La variable aléatoire Y égale au nombre d’individus de l’échantillon pos- 
sédant le caractère considéré est dans ce cas somme de  n v.a. de Bernoulli 
dépendantes, et de même paramètre. 


Notons p, la proportion d'individus dans la population (dont on désigne 
la taille par N) possédant le caractère étudié, et étudions la loi de cette varia- 
ble aléatoire Y d’abord en ce qui concerne les valeurs possibles, puis pour ce 
qui est des probabilités associées. 


Le nombre d’individus de la population possédant le caractère étudié est 
égal à Np, et le nombre de ceux qui ne le possède pas est égal à Ng. Le nombre 
maximum d'individus de l’échantillon possédant le caractère étudié ne peut 
être supérieur ni à la taille de l’échantillon, ni à Np. Par conséquent, la valeur 
maximum de Y est égale à min( n, Np). Le nombre minimum d’individus de 
l’échantillon possédant le caractère étudié est, bien entendu, au moins égal à0, 
mais aussi au moins égal à ( n — Nq). En effet, si le nombre d’individus ne 
possédant pas le caractère étudié, soit  Ng, est plus petit que la taille  n de 
l'échantillon, on aura au moins (n — Ngq) individus qui posséderont le caractère 
étudié dans l’échantillon. Il s’ensuit que le nombre minimum d’individus de 
l'échantillon possédant le caractère étudié est égal à max(0, n — Na). 


La variable aléatoire Y peut prendre toutes les valeurs entières comprises 
entre : 
max(0,n-Ng) et min(n, Np) 


Pour le calcul de P(Y = k), k étant l’une des valeurs possibles entre 
max (0, 7 — Ngq) et min(n, Np), on peut utiliser la méthode combinatoire clas- 
sique et calculer le rapport du nombre des occurences favorables au nombre 
des occurences possibles. 


Les occurences possibles sont représentées par le nombre d’échantillons 
de taille 7 qu’on peut extraire sans remise d’une population de taille N, c’est- 


dé el ) 
n 
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Les occurrences favorables sont représentées par les échantillons de taille 
n pour lesquels k individus possèdent le caractère étudié et ( n — k) individus 
ne le possèdent pas. 

Ces cas favorables sont ceux où l’on atiré k unités parmi les Np ayant le 


caractère étudié, en nombre P2 }: et (n — k) unités parmi les Ng ne le pos- 


n — 


sédant pas, en nombre ( M 21 On a donc : 


P(Y =k) = ES) pour max(0, n — Ng) < k < min (n, Np) 


On dit que la variable aléatoire Y suit une loi hypergéométrique de para- 
mètres NW, n et p, ce qu’on note Æ(N ; n ; p). 

L’espérance d’une telle variable aléatoire est E(Y) = np puisque Y est la 
somme de n variables de Bernoulli de paramètre p. La variance est égale à : 
N-n 
N-1 
mais, le calcul est plus délicat en raison de la non indépendance des varia- 
Nan - 1-2= 1 
N-1 N-I1 
d’exhaustivité. On remarque tout de suite que si le taux de sondage n/N est 
très petit, ce facteur d’exhaustivité est très proche de 1, et donc que l’expres- 
sion de la variance d’une loi hypergéométrique est très voisine de celle d’une 
loi binomiale. 


var(Y) = np(l-p): 


bles de Bernoulli. Le terme correctif 


est appelé facteur 


Plus généralement on peut montrer que la loi  Œ{(N ; n ; p) peut être 
approximée par une loi %(n ; p) dès que le taux de sondage n/N est infé- 
rieur à 10 %. Cette conclusion justifie l’utilisation des calculs sous l’hypo- 
thèse d’indépendance dès que le taux de sondage est assez petit, même si 
le tirage est exhaustif. 


C’est la raison pour laquelle en pratique, malgré des tirages d’échantillons 
le plus souvent exhaustifs, on se réfère à la loi binomiale, les probabilités 
calculées à l’aide de la loi binomiale donnant une bonne approximation des 
probabilités de la loi hypergéométrique dès que le taux de sondage est assez 
petit (c’est-à-dire inférieur à 10 %). 


En conclusion, la loi hypergéométrique %(N ; n ; p) est la distribution 
d’une somme de n variables aléatoires de Bernoulli non indépendantes. 
Une variable aléatoire hypergéométrique représente, dans un contexte de 
tirage exhaustif — c’est-à-dire de variables dépendantes — le nombre de réa- 
lisations parmi n épreuves de Bernoulli de l’un des termes d’une alterna- 
tive. Elle prend des valeurs comprises entre max(0, n — Ng) et min(n, Np). 
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Cette variable aléatoire a la même espérance np que la variable binomiale 
qui serait obtenue dans un contexte d’indépendance, mais sa variance est 
plus petite, diminuée dans un rapport 


N-n 

N-1 
appelé facteur d’exhaustivité. Dans le cas d’une très grande population ou 
plus généralement d’un taux de sondage faible (inférieur à 0,1), on peut 


supposer les tirages indépendants et remplacer la loi hypergéométrique 
AN ; n ; p) par la loi binomiale B(n ; p) 


C. L: loi géométrique et la loi de Pascal 


On se place dans une optique totalement différente, les conditions de base 
restant inchangées, c’est-à-dire qu’il y a toujours une succession d’épreuves 
de Bernoulli de même paramètre p, mais dont on ne connaît pas le nombre 
de répétitions : on ne s’arrête que lorsque le résultat auquel on s’intéresse est 
obtenu pour la 1" fois (cas de la loi géométrique) où pour la K® fois (loi de 
Pascal). 


À chaque épreuve élémentaire, est associée une variable de Bernoulli  X; 
qui prend la valeur 1 si le résultat auquel on s’intéresse s’est réalisé, et la 
valeur 0 sinon. On pose : 


PX;=1)=p et PX=0)=1-p=g 


On suppose que les épreuves sont répétées indépendamment les unes des 
autres. On désigne par Y le nombre total d’épreuves réalisées jusqu’à 
l’obtention du premier résultat élémentaire de probabilité p. Il est clair 
que Ÿ peut prendre toute valeur entière au moins égale à 1 (c’est-à-dire stric- 
tement positive), et que ces valeurs peuvent être aussi grandes que l’on veut. 
Nous rencontrons ici pour la première fois une variable aléatoire dont le nom- 
bre de valeurs possibles est infini. 


Cette définition doit être bien comprise, car dans certains cas on s’inté- 
resse au nombre Z d’épreuves précédant la première réalisation du résultat de 
probabilité p, et on a bien sûr :Z=Y-1 

Pour ce qui concerne la variable aléatoire Y, si le résultat codé 1 se produit 
pour la 1" fois à la £ épreuve, cela signifie que les (k — 1) premières épreuves 
ont produit le résultat complémentaire codé 0 de probabilité g. En raison de 
l'indépendance des épreuves on a : 


P(Y =k) = q:q".…."q"p = g“=-!-p 
(k= 1) fois 


LES PRINCIPAUX MODÈLES STATISTIQUES DISCRETS € 193 


On en déduit la fonction de répartition : 


On calcule aussi : 
. . = d 
= .ak-l:p=p: gl = p: —(gk 
EM = Yk-gl-p=p.Yk.q p DEAR 
k=1 k=1 k=1 
La série de terme général gl étant absolument convergente, la série des 


dérivées est égale à la dérivée de la série : 


E(Y) = 


| 
T 
M1: 
| 
S 
a 
1 
ur 
Il 
se 
SE 
MA 
8 
=. 
Lo” 


pie), À à 
dq\1 -q (-qg} pp 
On calcule de même le moment d’ordre 2 : 


E(Y?) = Dh a sp = p. DES 
k=1 


k=1 


S. D (ku-1+)ai ES DE Dai 44 pY ka 


k=1 k=1 k=1 


Le second terme de l’expression obtenue n’est autre que E(Y). Pour le pre- 
mier terme, on remarque que : 


pe SAR 1)gt 29 = pq: DK 1)g? 


k=1 k=1 


co S d2 
peq: D ER- qi? = pra ag) 
k=2 = 


car encore une fois la double dérivation sous le signe somme est licite en 
raison de la convergence absolue de la série. 


On obtient : 
. - d? < k 
p- D'AG- Lat-2q = Pa Er) 
k=:L k=2 
- E 1) - 2 _ 2q 
PTagui-g)  PTG-gp pp 
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et par conséquent : 


(y) = 2441 -24tb - q+pta _ tt 


p° pp p° p° p° 
On déduit la variance d’une variable aléatoire de loi géométrique 


var(Y) — get — 4 


p?  p? = p? 

Dans l’étude de la modélisation des situations concrètes de ce type, on 
doit faire très attention de préciser si on s’intéresse au nombre total Y 
d’épreuves alternatives réalisées jusqu’à l’obtention du premier résultat élé- 
mentaire de probabilité p (cas étudié), ou si on s’intéresse au nombre Z 


d’épreuves élémentaires de probabilité (1  — p) réalisées jusqu’à l’obtention 
du premier résultat de probabilité p. 

Comme nous l’avons déjà mentionné Z = Y — 1. Les valeurs possibles de 
Z sont toutes les valeurs entières positives ou nulle, alors que les valeurs pos- 
sibles de Y sont toutes les valeurs entières strictement positives. La relation 
entre Ÿ et Z implique qu’on peut calculer les probabilités associées à Z à par- 
üir de celles de Y: 


P(Z=À) = PE =k+41) = 4f.p 
P(Z<n) = P(Y<n+1) = 1-g"+! 
L’espérance mathématique de Z est égale à celle de  Y diminuée d’une 
unité : 


HAS Dermalsdielr 2 
P 


T 
T 


alors que les variances de Y et Z sont égales : 


var(Z) = var(Ÿ —-1) = var(Ÿ) 


She 


En résumé 


La loi géométrique de paramètre p caractérise le nombre d’épreuves de 
Bernoulli indépendantes qu’il faut réaliser pour obtenir pour la 1 " fois le 
résultat (de l’épreuve de Bernoulli) auquel on s’intéresse (codé 1). L’espé- 
=? 

p? 


: L : 
rance est égale à — et la variance à 


La loi de Pascal est la généralisation de la loi géométrique lorsqu’on 
recherche l’obtention pour la X® fois du résultat considéré. Une variable aléa- 
toire de Pascal Y dépend de deux paramètres p et K et peut prendre toutes 
valeurs entières au moins égales à K. 
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Pour calculer P(Y = j) pour j 2 K, on remarque que si le j° essai a donné le 
résultat de probabilité p, c’est qu’au cours des (j — 1) essais précédents, on aura 
obtenu (K — 1) fois ce résultat et ( j — K) fois le résultat contraire. On applique 
la combinatoire du schéma binomial, et la probabilité d’observer (j — K) fois le 
résultat de probabilité { g = 1 -p} et (K— 1) fois le résultat de probabilité p 
au cours de (j — 1) essais est donnée par : 

j—-1 K-l/1y ik 
(Jr "an 

Pour obtenir l’événement { Y = j}, il faut et il suffit que dans les ( j — 1) pre- 
miers essais, on ait obtenu (K — 1) fois le résultat de probabilité p et (j — K) fois 
le résultat contraire, et que le j° essai donne le résultat de probabilité p. En 
raison de l’indépendance des épreuves : 


P(Y =j) = (+ p'G-p) * pour j>K 


On peut montrer que moyenne et variance de la loi de Pascal de 
paramètres p et K sont donnés par : 


E(Y) = K à var(Y) = Ep) 
P P 

On doit bien porter attention au fait que la ressemblance avec les probabi- 
lités d’une loi binomiale n’est qu’apparente. En effet, non seulement la somme 
des exposants des termes p et (1 —p) n’est pas égale au nombre ( j — 1), mais 
ces probabilités sont définies pour toutes les valeurs de j au moins égales à K, 
et donc pour un ensemble de valeurs non borné. Pour une loi de Pascal, géné- 
ralisant la loi géométrique, c’est le nombre total d'épreuves, et non pas le nom- 
bre d'épreuves conduisant au résultat de probabilité p qui est aléatoire . 

Ces deux lois présentent une différence très importante avec la loi 
binomiale : le nombre de répétitions de l’épreuve élémentaire de Bernoulli 
n’est pas connu, et c’est lui qui représente l’aléatoire du problème. En parti- 
culier, une variable géométrique peut prendre toute valeur entière positive, 
sans limite supérieure. 

L’exemple suivant montre l’application de ces modèles et l’interprétation 
de leurs caractéristiques. 


D Exemple 
Supposons qu’on observe en moyenne 5 % de pièces défectueuses en 
sortie d’une chaîne de production lorsqu'elle est optimisée. Si on souhaite 
connaître la probabilité qu’un échantillon de 20 pièces issu de cette chaîne 
ne contienne aucune pièce défectueuse, on associe à chaque pièce un 
caractère à deux modalités, et cette modélisation de base amène à définir 
des variables de Bernoulli. 
Le paramètre de ces variables de Bernoulli étant égal à 0,05 puisque si 
5 % des pièces en moyennes sont défectueuses, cela revient à dire que la 
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probabilité qu’une pièce prise au hasard soit défectueuse est égale à 0,05 
(chapitre 5). On peut supposer les tirages indépendants en raison de la 
grande taille de la population (ici la production). 

Le schéma binomial est ici adapté puisqu'on recherche la probabilité 
d’un nombre donné de défectueux sur un échantillon de taille fixée. 
Pour cette loi %(20 ; 0,05), on a P(X = 0) = (0,95)20 = 0,3585 

Si d’autre part, on cherche à calculer la probabilité que le premier défec- 
tueux ne soit pas l’une des 20 premières pièces, on gardera la modélisa- 
tion des unités statistiques par les aléas de Bernoulli de paramètre 0,05 
toujours supposés indépendants pour les mêmes raisons. Mais le nom- 
bre de pièces étudiées n’étant plus donné, ce nombre devient l’aléa dont 
on a besoin de déterminer la loi de probabilité. 

Soit Y le nombre de pièces observées jusqu’à l’obtention de la première 
pièce défectueuse. La variable aléatoire Y est une variable aléatoire dis- 
tribuée selon une loi géométrique de paramètre 0,05 ; par conséquent : 


P(Y221) = Ÿ 0,95*-'.0,05 = 0,05 > 0,957" = 0,05 -Y 0,95 


K>21 k>21 j>20 


0,05 0,95. 5° 0,95’ 
i20 

Le. = 
1—0,95 


L’espérance mathématique de cette variable aléatoire Y étant égale à 20, 
on doit tirer en moyenne 20 pièces pour en observer une défectueuse, 
c’est-à-dire qu'avant de tirer une pièce défectueuse, on tire, en 
moyenne, 19 pièces qui ne le sont pas. 

La relation entre tous ces résultats est laissée au lecteur. 

Si on s’était intéressé au nombre de pièces à examiner pour en tirer deux 
défectueuses, on aurait une loi de Pascal d’espérance mathématique 
égale à 40. Ici encore, on laisse au lecteur le soin de comparer les deux 
derniers résultats. 


= P(Y>21) 


0,05 : 0,95. 0,95*° = 0,3585 


Ces deux lois, loi géométrique et loi de Pascal, interviennent particulièrement 
en contrôle de qualité, mais aussi dans la surveillance des événements dont une 
certaine fréquence de survenue est interprétée en terme de signal d’alarme. 


Les formules de la loi géométrique sont suffisamment simples pour que les cal- 
culs ne posent aucune difficulté avec une petite calculatrice, et pour la loi de Pas- 
cal, on peut recourir à quelques pas de programme comme pour la loi binomiale. 


— Remarque 


Les lois binomiale, hypergéométrique, géométrique et de Pascal sont 
donc toutes construites sur la base de la répétition d’épreuves à deux 
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issues (ou épreuves de Bernoulli). À l’exception de la loi hypergéomé- 
trique, elles se placent toutes dans un contexte d’épreuves indépendan- 
tes dont la caractéristique  p (probabilité de l’issue de l’alternative 
qu’on cherche à observer) est constante au cours du temps. 


Ceci correspond à une notion très développée dans la modélisation des 
phénomènes dépendant du temps, à savoir la stationnarité. Cette pro- 
priété n’est pas systématiquement rencontrée, et il faut apporter la plus 
grande attention à l’analyse de cette hypothèse dans toutes les situa- 
tions qu’on cherche à représenter. 


Beaucoup de cas ne correspondent pas en effet à une succession station- 
naire d’épreuves de Bernoulli indépendantes. Nous avons vu que l’indé- 
pendance stricto sensu pouvait quelquefois servir de représentation 
approchée à des tirages exhaustifs (pour un taux de sondage suffisam- 
ment faible), mais on devra soigneusement analyser le contexte pour 
reconnaître s’il est celui d’une parfaite stationnarité (c’est-à-dire de 
constance dans le temps du paramètre p des épreuves de Bernoulli suc- 
cessives), s’il est celui d’une stationnarité approximative, ou si cette con- 
dition ne peut être supposée (auquel cas les outils à mettre en œuvre sont 
plus complexes et débordent du propos de cet ouvrage). 


Le tableau suivant résume de façon synthétique les principaux modèles cons- 
truits à partir de l’itération du schéma de Bernoulli. 


À Nombre Valeur Valeur Type : . 
Loi SES Fu : 6 Espérance Variance 
d’itérations minimale maximale de tirage 
Bernoulli fixé 0 1 sans p pA -—p) 
Binomiale fixé 0 n indépendant np np(i — p) 
Zoe es : : N-n 
Hypergéométrique fixé max(0,n-—Ng) | min(n, Np) exhaustif np np(1- P)Y 1 
1-p 
Géométrique aléatoire 1 sans indépendant = 2 
P P 
K(1-p) 
Pascal aléatoire K sans indépendant K RE 
P P 


LR La loi de Poisson 


Cette loi peut être envisagée dans un contexte empirique (statistique), ou 
d’analyse (probabiliste). 
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A. Définitions et propriétés 


Définition 


Une variable aléatoire X ayant pour valeur possible tout nombre entier 
positif ou nul, et telle que : 


= =, PL 
PO =) = & Li 


pour tout 4 > 0 entier, est dite distribuée selon une loi de Poisson! de para- 
mètre m, m étant un nombre réel strictement positif. 


On remarque tout de suite qu’une telle variable aléatoire présente une diffé- 
rence essentielle avec les variables de Bernoulli ou binomiales, car elle est 
discrète, mais non finie (c’est-à-dire ici que les valeurs possibles ne sont pas 
limitées supérieurement). Nous avons déjà rencontré cette situation avec la 
loi géométrique et la loi de Pascal. 


Il s’agit bien d’une distribution de probabilité car, il est facile de le constater que: 
— toutes les probabilités sont positives ; 


— la somme des probabilités est égale à 1, compte tenu de l’expression de 
la série exponentielle : 


k k 
D P(X = k) = Vers =em. Ven. em = e0 =] 
k! k! 
k>0 k>0 k>0 
Le calcul de la moyenne est assez simple : 


DA P(X=R) = DE enr 


k>0 k20 


E(X) 


Il 
à 
Ë 
= [à 
Il 
3 
Ë 
VE 
Pare) 
= [à 


car le premier terme de la somme est nul. Par conséquent, 


mil nil 
E(X) = ee". = em. RE 
CE 2 '&-D1 bu 2 G- D: 


1. Siméon-Denis Poisson (1781-1840), mathématicien, probabiliste et physicien français, à qui 
on doit d’important développements sur la loi des grands nombres, sur les suites d'épreuves 
de Bernouilli, sur la loi de... Poisson, mais aussi sur les applications des probabilités dans les 
domaines du droit. 
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Le changement de variable j = k — 1 donne : 


Î 
E(X) = Me". Y— =m'e".em = m 
di j! 
j20 
Ce résultat justifie la notation m adoptée pour le paramètre de la loi de 
Poisson puisque ce paramètre n’est autre que la valeur moyenne. 
En ce qui concerne le moment d’ordre 2, le calcul du même a donne 
E(X?) = Je. P(X=K#k) = >. em. — 


k>0 k>0 
k k 
LL = em er 
k! 

k 


car le 1 ®" terme de la série étant nul, on peut commencer cette somme pour 
k=1 
On obtient ensuite : 


E(X2) = em Ye - = en DUU-1+8 7 


k21 k21 
= —m .m* .m* 
= e (Œuu-n n 2 "E 


Le deuxième terme de la dernière parenthèse n’est autre que E(X) soit 
m. Pour le calcul du premier terme, on remarque que le terme initial pour 
k= 1 est nul. On débute la somme à k= 2, et on simplifie par k(k-1) : 


k 
E(X2) = em KDE + m = em. DIT +m 


k>1 k>2 

m2 - mk-2 
= em. — + m 

2. 2)! 

soit : 
k-2 

E(X2) = me". me 

(X2) = m°-e 2&- 2 


En faisant le changement de variable { j = k —- 2} dans la dernière somme, 
on retrouve encore le développement de la série exponentielle, d’où : 
E(X2) = m-e".e"+m = m'+m 
Et on déduit la variance : 


2 
var(X) = EG) - (EX) = m'+m-m?=m 
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Ce résultat a un intérêt considérable, comme on le verra plus loin 


Pour une distribution de Poisson, moyenne et variance sont égales (et 
égales à la valeur du paramètre). 


On peut aussi calculer la fonction génératrice : 


= XN — k _nn* = em 
gx(u) = E(u*) = Y'uke a 
k20 k20 


= em. eum — p-m(l-u) 


ce qui permet d’obtenir le moment factoriel d’ordre r(r € NF) : UC) = m7 


La propriété suivante est très utile dans la construction des modèles régis 
par des lois de Poisson. 


Propriété 1 


Si X, et X, sont deux variables aléatoires indépendantes qui suivent des 
lois de Poisson respectivement de paramètres mm, et m,, alors Y=X,+X, 
suit une loi de Poisson de paramètre m, + m; 


En effet, la variable Y peut prendre toutes les valeurs entières, positives ou 
nulle. Calculons la probabilité qu’elle prenne l’une quelconque de ces valeurs. 


i=Rk 
P(Y =k) = AÜux-nnussk-n)] 
i=0 
i=k 
= DPAX =iN{X = ki) 
i=0 
i=k 
= > PUX =i}):PGX2=k-i}) 
i=0 
donc : 
PY=D = SPA =D-PX=k-D = Yemen. M 
ONE RES (X2 = É. OT 
soit : 
i= i. k-i —(m;+m,)i=k | | 
P(Y=k) _ TRS 7. _ € _ mi 
= il(k—i)! k! _ il(k—i)! 
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et on reconnaît dans la dernière somme le développement du binôme de 
Newton appliqué à la somme (m,+m;,)"*. Ce qui permet d’écrire : 


P(Y =k) = e (+2) . Gmi+ mi) 
k! 
ce résultat prouvant le résultat annoncé. 


— Remarque 


Ce résultat peut s’étendre à une somme finie de variables aléatoires 
indépendantes distribuées toutes selon des lois de Poisson. 


Il existe une forme réciproque de cette propriété. 


Propriété 2 


Si les variables aléatoires indépendantes  X et Y sont telles que la 
somme (X + Ÿ) est distribuée selon une loi de Poisson, alors les variables 
X et Y sont elles-mêmes distribuées selon des lois de Poisson. 


On ne démontrera pas cette propriété très utile. Il faut remarquer ici qu’on 
n’a pas le moyen direct de décomposer (pour cette propriété 2) le paramètre 
de (X + Y) en deux paramètres, l’un pour X et l’autre pour Y. 


Une propriété, elle aussi caractéristique de la loi de Poisson, est celle qui 
suit, obtenue aisément en écrivant le rapport des probabilités et en simplifiant: 


Propriété 3 


Si X suit une loi de Poisson de paramètre m, on a : 
LCD er 


P(X=k-1) k 


Cette propriété implique la croissance des probabilités ponctuelles 
P(X = k) tant que k < m, et la décroissance (rapide puisqu’inversement pro- 
portionnelle à k) dès que k > m. 

P(X = m) 
P(X=m-1) 
signifie qu’il existe deux valeurs, m et m — 1, qui ont même probabilité. Cette 
probabilité commune est la plus élevée d’après ce qu’on vient de voir. Par 


conséquent, la loi de Poisson possède deux valeurs modales lorsque son 
paramètre est un nombre entier . 


D'autre part si m est un entier, le rapport est égal à 1. Ceci 


202 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


B. Abord statistique 


D’après les propriétés qui viennent d’être montrées, on remarque qu’il est 
justifié d’envisager une loi de Poisson comme un modèle représentatif de 
données statistiques discrètes pour lesquelles la variable ne prend que 
des valeurs entières, positives ou nulle, et pour lesquelles : 


* la moyenne et la variance sont sensiblement égales ; 


Jk 


les rapports -—— de 2 fréquences consécutives sont inversement 
k-1 
proportionnels à k 


Il est fréquent que cette dernière condition ne soit vérifiée que pour les 
faibles valeurs de k. Dans la pratique, on accorde moins d’importance aux 
entorses à cette propriété pour les queues de distribution. 


Enfin, on prendra garde de bien noter qu’il ne s’agit là que d’une indication. Il 
est indispensable de justifier le choix d’un modèle par un jugement d’adéquation. 


C. Abord probabiliste 


Il s’agit maintenant de poser la loi de Poisson comme modèle d’une épreuve 
aléatoire avec l’aide d’une analyse raisonnée de cette épreuve. Un résultat est 
nécessaire à cette démarche. 


Propriété 4 


Les probabilités d’une loi binomiale @(n ; p) peuvent être approximées 
par les probabilités d’une loi de Poisson de paramètre np si les conditions 
suivantes sont réalisées : 


n>50 et p<O0,l 


Ceci implique que la loi de Poisson peut être considérée comme l’approxi- 
mation d’une loi binomiale qui représente la somme d’un grand nombre 
(n > 50) d’aléas de Bernoulli de faible paramètre ( p < 0,1). 


On remarque à ce sujet que si une variable aléatoire est distribuée selon 
une loi binomiale %(n ; p) pour laquelle n > 50 et p < 0,1, on aura g= 1 et 
par conséquent np = npgq. Si on approxime cette loi binomiale par une loi de 
Poisson P(np), on imagine que les deux lois doivent être assez proches pour 
que les espérances mathématiques, d’une part, et les variances, d’autre part, 
soient voisines, sinon même égales. Or, les espérances sont égales toutes 
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deux à np, mais les variances respectivement égales à npq pour la loi bino- 
miale et à np pour la loi de Poisson sont proches puisque qg = 1. La valeur de 
l’approximation apparaît bien liée à la faible valeur de p 


Bien évidemment, par symétrie, et en particulier en tenant compte de la 
propriété 2 vue au $ ITA, pour une variable X suivant une loi (n ; p) où 
n > 50 et p > 0,9, cette approximation sera appliquée à la variable (n — X) qui 
suit une loi B(n ; 1 —-p) 


Lorsqu'un événement a une faible probabilité ( p < 0,1) d’apparition lors 
d’une épreuve élémentaire, et si on répète cette épreuve un grand nombre de 
fois (n > 50), le nombre total de réalisations de l’événement considéré suit à 
peu près une loi de Poisson de paramètre np. Les graphiques de la figure 6.3a 
et 6.3b montrent la comparaison entre les diagrammes en bâtons de plusieurs 
lois binomiales et des lois de Poisson qui sont proposées comme approxima- 
tion. On retrouve en examinant ces graphiques que plus p est petit, meilleure 
est la qualité de l’approximation. 


Pour cette raison, la loi de Poisson a été appelée la loi des petites proba- 
bilités, ou loi des faibles occurences, ou loi des phénomènes rares. 


0,18 - %(60 : 0,1) 0,18- 
» RAI = 
0,16 16 60:0:15 
0,14 — 0,14+ ul 
0,12 - 6 0,12- 
0,10 - a 0,10+ 90) 
0,08 — 0,08 + 
0,06 — 0,06 + 
0,04 0,04 + 
0,02 — 0,02 + | | f 
0,00 + 0,00 -L-=l in … 
0,10- 0,10 
. (100 ; 0,25) 
0,09 0,09 0,29) 
0,08+ %(100 ; 0,4) 0,08 
he 0,07 
0,06 
0,05 P(25) 
a TT 
0,04 
0,03 
0,02 
0,01 
0,00 LI 


Figure 6.3a — Approximations de mauvaise qualité par la loi de Poisson 
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0,6 - 0,25- ‘%8(60 ; 0,05) 


0,5 - 0,20 - 
04 | (60 ; 0,01) 


0,15 - 
0,3 - 
0,10 - PL. 
02 - 
(0,6) À 
o1 - 0,05 [ 


0,0 | 0,00 


0,147 (100 ; 0,1) 0,207 %(100 ; 0,05) 
| 0,18 DE 
0,12 + : 0,164 
0,10- : 0,14- > IF 
0,12 
di __. L 0,10 - me 
0,06 + 0,08 + 
0,04 0,06 — 
0,04 
DiQel l 0,02 + Î | 
0,00 [il [on … 0,00 [en … 


Figure 6.3b — Approximations correctes par la loi de Poisson 


Voici quelques exemples où cette loi est évoquée 


* nombre de pièces défectueuses dans un échantillon de grande taille prélevé 
dans une production où la proportion des pièces défectueuses est faible ; 


+ nombre de naissances de quadruplés, de quintuplés, par an dans un pays 
fixé ; 

° nombre d’appels intercontinentaux sur une ligne pendant une période 
donnée. 


Les formules des probabilités de lois binomiale et de Poisson montrent 
bien l’intérêt de la seconde. Même avec une bonne calculatrice, il n’est pas 
aisé (et parfois pas possible directement) de calculer les probabilités d’une 
loi binomiale. Mais cependant, on ne recourra à l’approximation par la loi de 
Poisson que lorsqu’on ne peut aisément obtenir le résultat exact, c’est-à-dire 
qu’on ne cherchera pas à approximer la loi binomiale tant que le calcul est 
simple. 
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Les tables de la loi de Poisson ( cf. annexe IV) donnent les valeurs de la 
fonction de répartition pour les valeurs du paramètre : 


— entre 0 et 1 par pas de 0,1 
— entre 1 et 10 par pas de 0,5 
— entre 10 et 25 par pas de 1 


Comme pour la loi binomiale, l’usage des tables est limité à certaines 
valeurs du paramètre. On peut utiliser quelques pas de programme pour tous 
les calculs (annexe ID). 


Toutefois, lorsque m dépasse 25, on utilise l’approximation par la loi de 
Gauss et la correction de continuité (chapitre 7). 


La loi de Poisson de paramètre m est une loi caractérisée par l’égalité 
de sa moyenne et de sa variance, et dont les probabilités p, croissent tant 
que k < m, puis décroissent. Elle peut être envisagée comme une approxi- 
mation de la loi binomiale, donc comme la loi approchée de la somme 
d’un grand nombre (7 > 50) d’aléas de Bernoulli indépendants représen- 
tant une alternative dont l’une des issues est de probabilité très faible 
(p < 0,1). Elle est ainsi directement postulée comme modèle représen- 
tatif du nombre d’occurences au cours du temps pour un événement 
particulièrement peu probable, mais dont la probabilité de survenue est 
stable. 

On ajoutera encore qu’il s’agit d’un modèle particulièrement utilisé en 
pratique dans la gestion des files d’attente notamment, et qui est à l’origine 
de développements très importants dans l’analyse des séries d’événements 
(processus poissoniens). 


On n’oubliera pas : 


1. Que la loi de Bernoulli représente toute situation d’alternative dans 
laquelle une issue est codée 0 et l’autre codée 1 


2. Que la loi binomiale correspond à la somme d’un nombre fixé de 
variables aléatoires de Bernoulli de même paramètre et indépendantes 
(donc à un tirage avec remise) 


3. Que la loi hypergéométrique correspond à la somme d’un nombre 
fixé de variables aléatoires de Bernoulli de même paramètre, mais dans 
un tirage sans remise 


4. Que la loi géométrique correspond à la somme de variables aléatoi- 
res de Bernoulli de même paramètre et indépendantes, mais en nombre 
aléatoire 


5. Que la moyenne et la variance d’une variable aléatoire de Poisson 
sont égales 
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Exercices (corrigés page 319) 


Exercice 6.1 


Des sondages permettent de constater que 10  % de la population est constituée de 
gauchers. On considère donc, dans cet exercice, que la probabilité qu’un individu pris 
au hasard soit gaucher est égale à 0,1 et celle qu’il soit droitier est égale à 0,9. 


1. Calculez la probabilité qu’un groupe de 10 individus contienne 
— au moins un gaucher ; 
— au plus trois gauchers. 


2. Un atelier de couture est équipé de 9 paires de ciseaux pour droitiers et de 3 paires 
de ciseaux pour gauchers. Quelle est la probabilité que chacun des 10 membres du 
personnel trouve une paire de ciseaux à sa convenance ? 


3. Soit Z la variable aléatoire égale au nombre de personnes ayant trouvé une paire 
de ciseaux à sa convenance. Etablir un tableau donnant Z en fonction du nombre 
Y de gauchers dans les 10 membres du personnel. En déduire la loi de probabilité 
de Z. 


Exercice 6.2 


Une compagnie d’assurances envisage de créer des polices d’assurances individuelles 
contre un certain type d’accidents. Une enquête préalable du service statistique a per- 
mis d’estimer qu’au cours d’une année, chaque personne a une chance sur 5000 envi- 
ron d’être victime d’un accident couvert par ce type de police, et que la compagnie 
pourra vendre en moyenne 10 000 polices d’assurance de ce type par an. 


Déterminez la probabilité que le nombre d’accidentés ne dépasse pas trois par an (on 
supposera que chaque personne assurée a au plus un accident par an). 


Exercice 6.3 


La société Alpha a vendu deux machines de pesage à la société Beta qui est une 
société de prestations de services. La Société Beta loue ces machines à la journée. Le 
prix de location lui laisse, par jour et par machine, une marge brute de 20 <€. Chaque 
machine est immobilisée 1 jour sur 10 au hasard, pour réglage et contrôle. 


1. Donnez, en la justifiant, la loi de la variable aléatoire Y égale au nombre de machi- 
nes disponibles un jour quelconque. 


2. Par ailleurs, on admet que le nombre d’entreprises désirant louer une machine 
pour une journée est une variable aléatoire Z ainsi définie : 


Valeurs de Z 0 1 2 3 


Probabilité 0,1 0,2 0,4 0,3 


Cette loi de demande reste invariable au cours du temps et n’a aucune incidence 
sur le planning des immobilisations pour vérification, car aucune régularité tem- 
porelle n’a été décelée. Une entreprise est satisfaite si elle repart avec une 
machine. Soit N, la variable aléatoire égale au nombre d’entreprises satisfaites au 
cours d’une journée. 
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2.1. Quelles sont les valeurs possibles de N ? 


2.2. En déduire la loi de N, ainsi que son espérance mathématique. Donnez la 
marge brute moyenne réalisée au cours d’une journée. 


3. La société Alpha constate qu’une machine sur 20 tombe en panne la première 
année (on suppose qu’une machine ne peut pas tomber plus d’une fois en panne 
au cours d’une année). Le coût de réparation est de 200 € par machine. 


Au lieu de garantir les machines pendant un an, la société Alpha propose de faire 
un discount de 20 € par machine aux acheteurs éventuels qui se chargeront eux- 
mêmes des réparations. 


Vous êtes président-directeur général d’une société qui achète 60 machines. Quel 
choix ferez-vous si votre décision est prise en fonction de chacun des deux critères 
suivants : 

— vouloir ne pas y perdre en moyenne ; 

— refuser de courir un risque supérieur à 1 % de voir la remise consentie être infé- 
rieure au coût de réparation. 


Exercice 6.4 


Lors de tests d’accès à un ordinateur central par réseau télématique, on a constaté que 
95 % des essais permettaient une connexion correcte. Une entreprise doit se connec- 
ter 5 fois dans la journée pour la mise à jour de ses fichiers. Soit Y le nombre d’essais 
nécessaires pour se connecter 5 fois. 


1. Déterminez la loi de probabilité de la v.a. Ÿ, ainsi que son espérance et sa variance. 
2. Calculez P(Y = 5) et P(Y > 6). 


Exercice 6.5 


Soit X, le nombre de demandes d’accès à une ressource informatique en partage, pen- 
dant un intervalle de temps de durée f fixée. On suppose X, distribuée selon une loi 
de Poisson de paramètre 11 = Ar. Lorsque cette ressource est saturée, ce qui se produit 
avec une probabilité 7, la demande ne peut être satisfaite. Soit Y, le nombre de 

demandes satisfaites durant l’intervalle de temps de longueur t. 


1. Montrez que la v.a. conditionnelle {Ÿ, | X,= x} suit une loi binomiale dont on 
déterminera les paramètres. 


2. Montrez que Y, suit une loi de Poisson de paramètre HT 


3. On se donne 1 = 10 et x = 0,2, l’unité de temps étant la seconde. 
Calculez : P(Y,<8) et P(3<7Y,< 10) 


Exercice 6.6 


Dans une étude sur le comportement d’achat de consommateurs, on suppose qu’à 
chaque minute, une unité (au maximum) d’un certain produit a 1 % de chances d’être 
vendue. On suppose les achats de ce produit effectués à des temps différents, indé- 
pendants les uns des autres. 


1. Quelle est la loi de probabilité exacte du nombre d’unités de ce produit vendues 
en 30 min ? 
Calculez la probabilité de vendre au moins 3 unités en 30 min. 

2. Le magasin est ouvert 7 h 30 par jour. Quel est le nombre moyen d’unités vendues 
par jour ? 


Par quelle loi peut-on approcher la loi de probabilité du nombre d’unités de ce 
produit vendues en un jour ? 
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3. Chaque matin, le stock est reconstitué à 8 unités pour le premier produit, et à 
220 unités pour le second. Quelle est la probabilité de rupture de stock pour cha- 
cun des deux produits ? 


Exercice 6.7 


Dans un grand magasin, des observations sur un grand nombre de jours ouvrables au 
rayon des magnétoscopes ont amené à faire l’hypothèse selon laquelle le nombre de 
magnétoscopes X vendus au cours d’un jour ouvrable quelconque suit une loi de 
Poisson de paramètre 5. Les ventes sont supposées indépendantes. 


1. Calculez la probabilité de chacun des événements suivants 
— la vente journalière de magnétoscopes est au plus égale à2 ; 
— la vente journalière de magnétoscopes est au plus égale à 2 ou au moins égale à 
6; 
— la vente journalière de magnétoscopes est au plus égale à 6 sachant qu’elle est 
au moins égale à 2. 


D 


Donnez, en la justifiant, la loi de la somme des ventes de deux jours consécutifs. 


Calculez la probabilité que la somme des ventes de deux jours consécutifs soit 
égale à 10. 


3. Le directeur du magasin décide de faire pendant une semaine une campagne publi- 
citaire sur les magnétoscopes. 


Il estime que, pendant cette semaine, la vente journalière suivra toujours une loi de 
Poisson et que son paramètre À sera égal à 6 avec une probabilité égale à 2/3 ou 
à 8 avec une probabilité égale à 1/3. 


Quelle est alors la probabilité que, pendant cette campagne publicitaire, la vente 
journalière de magnétoscopes soit au moins égale à3 ? 


Exercice 6.8 


Dans une grande ville, la régie des transports urbains dispose de 1 000 autobus. Des 
observations antérieures ont montré que la probabilité qu’un autobus tombe en panne 
un jour donné est égale à 0,0025. Soit Y le nombre d’autobus en panne un jour donné. 


1. Déterminez, en la justifiant, la loi de la variable aléatoire  Y. Calculez son espé- 
rance et sa variance. 


2. Donnez, en la justifiant, une loi approximative de la loi de la variable aléatoire Y. 

3. Calculez P (3 < Y <7). 

4. Quelle doit être la capacité minimum du service de maintenance des autobus pour 
que la probabilité que toutes les pannes soient traitées dans la journée, soit au 
moins égale à 0,998 ? 

5. Le service de maintenance peut, en fait, réparer 6 pannes par jour. Calculez la 
probabilité que, un jour quelconque, ce service soit dans l’incapacité de réparer 
tous les autobus tombés en panne. 

6. Soit Z, le nombre de jours de l’année (année de 365 jours) pour lesquels la main- 
tenance est insuffisante. Déterminez, en la justifiant, la loi de la variable aléatoire 
Z, ainsi qu’une loi approchée. En déduire la probabilité que la maintenance soit 
suffisante tous les jours de l’année. 


D'après examen de juin 2000, GEA 1° année Paris IX-Dauphine 
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Exercice 6.9 


Le nombre de véhicules se présentant au péage À de l’autoroute du « Soleil » pendant 
un certain intervalle de temps T est supposé suivre une loi de Poisson de paramètre 3, 
et le nombre de véhicules se présentant au péage B de la même autoroute pendant le 
même intervalle de temps est supposé suivre une loi de Poisson de paramètre 2. 


1. Déterminez la loi du nombre de véhicules se présentant à l’un ou l’autre des deux 
péages pendant un laps de temps T en précisant l’hypothèse nécessaire. 


2. Calculez la probabilité que 8 véhicules se présentent à l’un ou l’autre des deux 
péages pendant un intervalle de temps 7. 

3. Sachant que 8 véhicules se sont présentés à l’un ou l’autre des deux péages, quelle 
est la probabilité qu’il y en ait eu 5 au péage À (toujours pendant un même laps 
de temps 7) ? 

D'après examen de juin 2006, DUGEAD 1" année Paris-Dauphine 


Exercice 6.10 


Les données suivantes, basées sur les annales de dix corps de l’armée prussienne sur 
une période de vingt ans à la fin du xixe siècle, rendent compte du nombre de cava- 
liers tués par une ruade de cheval au cours d’une année. 


Nombre de décès x} 0 1 2 3 4 5 ou + 


Cumul des années n} 109 65 22 3 1 0 


Données recueillies par le statisticien L. Bortkiewicz 


1. Calculez la moyenne et la variance de cette distribution. 
2. Proposez, en la justifiant, une loi de probabilité pour ajuster cette distribution. 
D'après examen de septembre 2005, DUGEAD 1" année Paris-Dauphine 
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7 = Le principaux 


modèles statistiques 
continus 


1. Modèles continus simples 


A. L: loi uniforme continue 


Nous avons déjà abordé la notion d’équiprobabilité dans les distributions sta- 
tistiques discrètes au $ L.B du chapitre 6 avec la loi uniforme discrète. Nous allons 
l’adapter au cas d’une variable aléatoire continue. Pour une telle variable, on ne 
peut pas parler de probabilité pour des valeurs isolées, et on imaginera la proba- 
bilité comme une masse répartie de façon diffuse. Il est clair alors que l’équipro- 
babilité se traduira par une probabilité d’intervalle proportionnelle à la longueur 
de l'intervalle. La probabilité cumulée sur tout R étant limitée à l’unité, on ne 
pourra avoir de probabilité non nulle que sur un sous-ensemble borné de R. 


Définition 


Une variable aléatoire X, absolument continue, suit une loi uniforme 
continue sur l'intervalle [a, b] € R si sa densité de probabilité est donnée par: 


…l# si xe [a, b] 
1) | si xe ab] 


Compte tenu des propriétés d’une densité de probabilité, il résulte que 
k> 0 et que : 


Il 
b-a 


b 
1 = |f(x)dx = |kdx = k(b-a) >  k= 
pri 
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L’intervalle sur lequel la densité n’est pas nulle est nécessairement fini. 
Cette contrainte apparaît tout à fait naturelle si on interprète la probabilité 
comme une masse. 


D'autre part, 
Fa) = [f(dt 


par conséquent F,(x) = 0 si x < a, alors que pour x Ee Ja, bl, on aura : 


X 


|; = 4-4 
— a b-a 


FE, (x) = [rca = [o-ar+ 


a 


et enfin si 
b 


. , . : : 
seb F9 = [fé = [0-d+ [> ren 


- a — a 


a 


La densité de probabilité d’une loi uniforme continue est donc constante 
par morceaux, tandis que sa fonction de répartition est linéaire croissante par 
morceaux (cf. figure 7.1, i et ii). 


Figure 7.1 — Densité (i) et fonction de répartition (ii) de la loi uniforme continue 


Pour ce qui concerne les moments de X: 


b 


E(X) = fafcodx = [dx = > 


R a 


et plus généralement : 


è k+1 _ gk+l 
EX) = fra = le ER 
— a 
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ce qui donne en particulier : 
E(X2) = 10 + ab + a?) 
et par conséquent : 


ox) = E(X?)-(E(X)) = BE 


On note que la loi uniforme continue est symétrique, et que par conséquent, 
sa médiane et sa moyenne sont confondues au milieu de l’intervalle | a, b]. 
Comme pour la loi uniforme discrète, ce résultat est naturel compte tenu de 
l’équiprobabilité. Le calcul du coefficient d’asymétrie y, de Fisher retrouve 
cette propriété puisque y, = 0. On notera que cette distribution n’a pas de 
mode au sens strict. 


Les fractiles de la loi uniforme continue sont très aisément calculables, 
comme pour toute distribution continue dont la fonction de répartition 
s’exprime analytiquement, et ici le calcul est particulièrement simple. En 
effet le fractile x,, d'ordre & est défini par Fy(x,) = ©. Il correspond à : 


Xo — 4 : 
—— = @,soit x, = a+@-(b-a) 
b-a 
On retrouve la valeur de la médiane, égale à la moyenne, soit 
1 b+a 
Xos = a+=(b-a) = 
os = 4+3(b-a) = 


Il faut remarquer que pour cette loi, la probabilité de voir une réalisation 
appartenir à un intervalle donné ne dépend que de la longueur de cet inter- 
valle, et qu’elle ne dépend pas de la position de cet intervalle. Deux interval- 
les de même longueur auront la même probabilité, à condition qu’ils soient 
tous deux inclus dans [ a, b], domaine de définition de X. 


Compte tenu de la symétrie de cette loi, on peut aussi adopter la définition 
suivante. 

Une variable aléatoire X est uniforme continue sur[a—-h,a+ h]sisa 
densité est définie par : 


fœ 5 si xea-h,a+hl] 
X) = 
0 si xé[a-h,a+h] 


L’équivalence des deux définitions est laissée au lecteur. C’est, historique- 
ment, cette seconde définition qui est à l’origine d’une grande utilisation de la loi 
uniforme continue dans le domaine de la prise en compte des erreurs d’arrondi 1. 


1. On a ainsi pu étudier que la répartition des erreurs d’arrondi suit une loi uniforme continue 
dans de nombreux cas. 
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Cette distribution uniforme recouvre très naturellement la notion d’équipro- 
babilité dans le contexte de répartitions continues, et elle a été probablement 
utilisée comme telle avant le XVII siècle, date des premiers écrits la concernant. 


La loi uniforme continue est, en raison de son lien avec l’équiprobabilité, à 
l’origine de multiples modélisations (en sociologie, économie, gestion de flux, 
gestion de stocks, biologie, physique). On doit également mentionner son inté- 
rêt pour la simulation! des modèles, quel que soit le domaine d’application. Le 
résultat fondamental sur lequel reposent ces simulations est le suivant. 


Théorème 


Soit X une variable aléatoire continue dont la fonction de répartition 
F(x) est supposée bijective. Alors la variable aléatoire Y = F{X) suit une loi 
uniforme continue sur [0 ; 1]. 


En effet, la fonction F étant bijective et monotone, elle admet une réci- 
proque qu’on note F-1, Si on écrit la fonction de répartition de Y, on obtient : 


PŒY < y) = P(X) < y) = PX < F1) = FIF ON] = y 
ce qui prouve le résultat annoncé. 


Partant donc d’une réalisation y de variable aléatoire distribuée selon une 
loi uniforme sur [0 ; 1], on peut reconstruire une réalisation x de variable aléa- 
toire X de fonction de répartition F donnée en calculant x = F-1(y). Connaissant 
des réalisations de loi uniforme discrète, il est possible d’obtenir des réalisa- 
tions pour une loi quelconque à partir du moment où on connaît sa fonction 
de répartition (analytiquement ou avec ses valeurs point par point). 


Cette méthode extrêmement simple dans son principe (et basée sur un résul- 
tat élémentaire) permet une très grande quantité d’applications, que ce soit 
entre autres pour la simulation de modèles réels (flux, stocks...) ou pour l’étude 
de phénomènes aléatoires dont la distribution n’est pas connue a priori. 


B. L: loi exponentielle 


Dans ce paragraphe, on présente la loi exponentielle sous son aspect le 
plus simple, sans tenir compte de la famille de lois dans laquelle elle se place. 
Afin de ne pas donner un contexte trop abstrait et mathématique, on ne par- 
lera pas des lois gamma et des propriétés qui en découlent pour la loi expo- 
nentielle. Toutefois, en conclusion de ce paragraphe, on mentionnera les 
relations de ce modèle exponentiel avec des modèles correspondant à des 
schémas précis d'identification. Le but de cette présentation étant essentiel- 
lement de comprendre la nature des phénomènes aléatoires pour lesquels on 
envisage une représentation de type loi exponentielle ou dérivée de ce type. 


1. Une présentation simple de la simulation, avec des exemples, est donnée à l’annexe III. 
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Définition 


On dit qu’une variable continue X suitune loi exponentielle de 
paramètres À > 0 et @ lorsque sa densité est : 
1 à 
—enat)i Sir 
F(X) = 4X 
0 si x<6 


La figure 7.2 montre l’allure des courbes représentatives de la densité de 
la loi exponentielle de paramètres 0 et À. 


2 
1,6 
1,2 
0,8 


0,4 


0 


0=1 0=2 


Figure 7.2 — Densités de lois exponentielles pour différentes valeurs de @(1 et 2) 
et de À (0,5, 1 er 2) 


Les situations usuelles correspondent au choix de 8 = 0, ce que nous gar- 
derons pour la suite, en prenant pour densité la fonction 


Xl si x>0 


1 
fG) = 1° 
0 si x<0 


qui est ainsi une distribution à un seul paramètre. Le cas particulier où À=1 
est dit loi exponentielle standard. 


Un calcul élémentaire montre que la fonction de répartition (si 8 = 0) est 


donnée par : 
i x<0 
rie 0 Si X 
1—-e-xx si x20 


Calculons les moments de cette distribution : 


co 


E(X") = Jr -e x}. dx 


0 
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qui devient par le changement de variable 1 = . 5 


E(X*) = fr-an.er.2. di = M fn -et-di 


0 


[æ] 


dont le calcul est très simple ! en appliquant une intégration par parties à la 
dernière intégrale : 


co 


L = fées = Eee feet di = k-1,: 
0 0 
ce qui permet d’écrire : 
= Ki = k-(kK-1)-1,, =... = kK-(k-1)-(k-2)-..-2-1:-1, 


et puisque JL, est égal à 1 (intégrale de la densité), on obtient finalement 
1,= k! et : 


E(X®) = KI. 


Pour cette distribution exponentielle à un paramètre À (6 étant nul), 
l'espérance et l’écart-type sont tous deux égaux à À, alors que la variance 
est égale à 2 


EX)=X et var(X)=22 


Dans le cas particulier de la loi exponentielle standard, il y a égalité de 
l’espérance, de la variance et de l’écart-type, tous égaux à l’unité. On peut 
établir un parallèle avec la loi discrète qui possède une propriété analogue, 
c’est-à-dire la loi de Poisson pour laquelle l’espérance est égale à la variance, 
mais non à l’écart-type (chapitre 6, $ IIL.A). 


Ce modèle correspond à des phénomènes aléatoires dont les « valeurs »2 
positives sont d’autant moins probables qu’elles sont grandes, la décroissance 
étant de type exponentiel. En pratique, on a souvent recours à un modèle 
exponentiel lorsqu'on a une variable continue positive, dont la moyenne et 
l’écart-type sont sensiblement égaux, et dont les probabilités d’intervalles de 
longueur fixe décroissent rapidement au fur et à mesure qu’ils concernent des 
valeurs élevées. 


1. On notera que cette intégrale 1, n’est autre que la valeur de la fonction eulérienne classique 
gamma pour l’entier (k + 1), soit L'(k + 1). 

2. Le terme « valeur » ici ne doit pas prêter à confusion et concerne en toute rigueur un inter- 
valle infiniment petit entourant une valeur ponctuelle  ; ce terme est utilisé ici pour ne pas 
alourdir inutilement la présentation. 
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Une situation très classique aussi où on envisage un modèle exponentiel 
est celle où on s’intéresse au délai de survenue d'événements aléatoires dans 
le temps (souvent appelé durée de vie), et où on admet que le devenir X d’un 
individu (au sens statistique du terme) ne dépend pas de son âge 


P(X< xo+x[X > x5) = P(X< x) Vx>0, Vx,>0 
On peut montrer que cette condition implique que X suit une loi de type 
exponentiel. 


Ces modèles de durée de vie sont particulièrement utilisés en économie 
du travail et dans l’étude de l’amortissement des investissements, mais aussi 
bien entendu en fiabilité des matériels et en médecine. 


Parmi les autres domaines d’application de la loi exponentielle, on citera 
la démographie et les files d’attente. 


Les deux propriétés suivantes (données sans justification ni démonstration) 
peuvent être utiles pour l’identification d’une distribution exponentielle : 


1. Si X, et X, sont deux variables indépendantes absolument continues tel- 
les que V = min(X,, X,) et W=(X, — X,) soient indépendantes, alors X, et X, 
sont des variables aléatoires exponentielles de même paramètre 6, mais pou- 
vant avoir des écarts-type À, et À, différents. 


2. Si X, et X, sont deux variables de même distribution absolument continue, 


etsi T = suit une loi uniforme continue sur [0 ; 1], indépendante 
1 + À) 


de (X; + X,), alors X; et X, sont distribuées selon une loi exponentielle de 
mêmes paramètres 0 = 0 et À. 
L'écriture très simple de la fonction de répartition : 


1 x<0 
Fo = 0 Si x 
1—e-À si x>0 


rend tous les calculs très simples avec une petite calculatrice. 


Ainsi pour la loi exponentielle de paramètre À = 2, on peut calculer la 
valeur du premier décile D, telque F(D;,)=0,1, d’où exp(- D,/2) = 0,9 et 
D; =0,21072 


De même, la valeur du premier quartile Q, est telle que F(Q,) = 0,25, d’où : 
exp(— Q,/2) = 0,75 ou encore Q, = — 21n(0,75) = 0,57536 
De même encore, la valeur de la médiane Q, est telle que F(Q,) = 0,5, d’où : 
Q; = — 21n(0,5) = 1,386 
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Ces trois valeurs particulières ont été reportées sur la figure 7.3. 


1,0 
0,8 
0,6 
0,4 


0,2 


0 D; @ 1 Q 2 3 4 5 


Figure 7.3 — Loi exponentielle de paramètres 0 =0 et }=2: 
premier décile, premier quartile, médiane 


Parmi les distributions de probabilité étroitement liées à la loi exponen- 
tielle, on citera : 

e la loi de Weibull (étudiée au $ IV.C) très utilisée dans les modèles de durée 

de vie ; elle correspond à une variable aléatoire  X telleque Y=(X-À)° 

suive une distribution exponentielle de paramètres 0 = 0 et À : 

° la première loi de Laplace utile en statistique dès lors qu’on dispose de 

données dans lesquelles certaines valeurs sont « extrêmes » ; elle corres- 

pond à une double distribution exponentielle « en miroir » autour de la 

valeur 8 ; 

* la Loi dite du ? à 2 degrés de liberté (reprise au $ IIL.A) qui n’est autre 

qu’une loi exponentielle pour laquelle 8 = 0 et À=2 ; 

° la loi d’Erlang, extrêmement utilisée en gestion des files d’attente et fia- 

bilité, est la loi suivie par la variable 


dans laquelle les X;(j = 1, 2,... , n) sont indépendantes, toutes de loi expo- 
nentielle standard, et où les à; sont tous distincts. 
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11. La loi normale ou loi de Laplace-Gauss 


On dit encore loi de Gauss ou loi gaussienne, ou plus simplement une gaus- 
sienne (au lieu de variable aléatoire distribuée selon une loi de Gauss). 


A. L: loi normale centrée réduite 


Définition 


Une variable aléatoire suit une loi normale centrée réduite si elle peut 
prendre toute valeur réelle et si sa densité de probabilité est donnée par 


FU) = T2) 


Cette fonction de densité est une fonction paire, et son graphique admet 
l’axe des ordonnées comme axe de symétrie. Il y a un maximum pour x=0 
qui correspond au mode de cette distribution. Compte tenu de deux points 
d’inflexion, le graphique est simple à tracer et présente l’allure caractéristi- 
que connue sous le nom de courbe en cloche (cf. figure 7.4). 


-4 -3 -2 -1 0 1 2 3 
Figure 7.4 — Densité de la loi normale centrée réduite 
Il n'existe pas de fonction analytiquement exprimable qui corresponde à 


une primitive de la fonction de densité f. La fonction de répartition d’une loi 
normale centrée réduite s’écrit : 


Le 
F(x) = = xt 2/2)dt 
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+00 


Le produit f:f{t) étant une fonction impaire : J t-exp(—12/2) - dt = 0 


et il s'ensuit que ÆE(X) = 0. Ce résultat justifie le nom de variable centrée. 
Plus généralement la fonction 2k +1. f{r) étant impaire, on a : E(X2Æ +1) = 0 
Pour le calcul de la variance, on calcule d’abord E(X2) par une intégration 
par parties et on obtient : 


1 pie 2 
— t-exp(-#2/2) . dt 
N2T [_ 


| +0 me 
= fr: —12/2)] 2 + —12/2) : dt 
N2T | "p) | le Dhs | 


Le premier terme de l’accolade étant nul, il s’ensuit : 


E(X?) = _ ['expt-2/2) dt 1 
T —0co 


E(X?) 


puisque le second membre n’est autre que l’intégrale de la densité sur 
l’ensemble des réels. 

Ce résultat justifie le nom de variable réduite. 

Cette distribution de probabilité possède une moyenne égale à 0. Le gra- 
phique étant symétrique par rapport à l’axe des ordonnées (parité de la den- 
sité), on a une surface totale (égale à 1) comprise entre la courbe et l’axe des 
abscisses, partagée en deux parties égales par l’axe vertical (soit 0,5 à gauche 
et 0,5 à droite). La médiane de cette distribution est aussi égale à 0. Enfin, le 
sommet de la « cloche » est au point x =0 


Propriété 1 
Pour la loi normale centrée réduite , la valeur 0 représente à la fois la 
moyenne, la médiane et le mode. 


On verra au $ IL.C, et au-delà, l’importance de cette propriété pour 
l’ensemble des applications du calcul des probabilités liées à la loi normale, 
centrée réduite ou non. 

Par la suite cette v.a. normale centrée réduite sera toujours notée U 
pour bien l’identifier. 


B. L: loi normale N'(r#2 ; 6) 


Une variable normale centrée réduite U a pour moyenne 0 et pe variance 1. 
Prenons alors une variable X telle que X=aU+b(avecae Ketbe R). Il 
est clair que : 


EX) =aE (U)+b=b et var (X) = 42: var(U) = & 
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Mais on peut aller plus loin encore et déterminer la fonction de répartition 
de X puis sa densité : 


P[u <=?) si a>0 
a 
Fra) = P(X <a) = P(aU+b<x) = 


1-p{u <E=Ë) si a<0 


a 


x—b 
Br : 
—— | “ exp(-12/2) - dt si a>0 
N2T [' 
x—b 


= FE, (x) = 


1-1 fe expt-#/2) dt si a<0 
V2r 


On dérive cette fonction par rapport à x pour obtenir la densité de X: 


1 
fx (x) = 
lal /27 
Sur cette expression, On remarque que pour a= 1 et b =0, on retrouve la 
densité de la loi normale centrée réduite. Dans le cas général, b représente la 
moyenne et |a| l’écart-type. 


exp{— (x—-b}?/2a?} 


Ceci conduit à poser que X suit une loi normale de moyenne m et d’écart- 
type 6 lorsque X prend toute valeur réelle avec la densité : 


fx (x) = 


exp{- (x-m)2/262} 

GV2T 
et la loi normale centrée réduite en est un cas particulier. Ce résultat d’une 
importance pratique considérable, peut se présenter sous la forme générale 
suivante. 


Propriété 2 


Si X est une variable aléatoire normale, alors toute fonction du 
1er degré (fonction affine) de X suit aussi une loi normale. 


Ainsi que nous l’avons vu, la densité d’une variable normale, donc sa loi, 
dépend de deux paramètres. On a montré que le premier paramètre n’est autre 
que sa moyenne tandis que le second correspond à son écart-type. Une varia- 
ble aléatoire normale est entièrement déterminée par sa moyenne et son 
écart-type. 
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Dans le cas d’une variable aléatoire  X distribuée selon une loi normale 
N (m ; 6), la variable aléatoire Y = aX + b suivant aussi une loi normale avec 
E(Y) = am + b et var(Y) = 4262 (l’écart-type de Y valant «al 6), Y est distri- 
buée selon une loi normale N'(am + b ; |alo). 


X-m 


En particulier, on peut construire la variable de moyenne nulle et 


m | : 
est la variable normale centrée 


d’écart-type égal à 1 ; on dit alors que = 
réduite déduite de X. C’est elle qui permet de faire aisément tous les calculs 
relatifs à X ($ IL.C). 


Réciproquement, toute v.a. X distribuée selon une loi de Gauss N'(m ; 6) 
peut s’écrire À = OÙ + m où U est une variable aléatoire distribuée selon une 
loi de Gauss centrée réduite. 


L'étude de la densité 


_ _(x-m} 
f = = Len] Er | 


d’une variable aléatoire normale N° (m ; 6) montre une courbe « en cloche » 
avec un axe de symétrie vertical en x = m. 


La valeur de la moyenne détermine l’axe de la courbe de densité. Pour 
deux densités correspondant à un même écart-type, mais à deux moyennes 
différentes, on obtient deux courbes décalées (translatées) l’une par rapport 
à l’autre. 


Comme on le constate aisément, le sommet de la courbe en cloche a pour 
ordonnée : 


1 
6/27 


Cette valeur inversement proportionnelle à © signifie que plus grand est 
l’écart-type d’une loi de Gauss, plus petit est le maximum de sa densité. Étant 
donné que la surface totale sous la courbe est constante (et égale à l’unité), 
on en déduit que la courbe est d’autant plus «  aplatie » que l’écart-type est 
grand. 


Au total, pour une valeur moyenne constante (sinon, il suffit de raison- 
ner en translatant la courbe), plus l’écart-type est grand (c’est-à-dire plus 
la dispersion de la distribution est élevée), plus la densité aura des extré- 
mités (aussi appelées queues de distribution) épaisses, compensant ainsi un 
sommet peu marqué. Inversement, plus l’écart-type est petit (c’est-à-dire 
plus la distribution est concentrée autour de sa moyenne) et plus le sommet 
de sa densité sera élevé, diminuant d’autant l’épaisseur aux extrémités 
(cf. figure 7.5). 
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Un écart-type petit correspond à une distribution resserrée autour de la 
moyenne, c’est-à-dire montrant par la finesse des queues de distribution que 
la probabilité de s’écarter « beaucoup » de la moyenne diminue très forte- 
ment en sens inverse de l’écart-type. 


Nous avons déjà dit qu’une loi de Gauss était totalement caractérisée par 
sa moyenne et son écart-type. Nous voyons maintenant que, pour une telle 
distribution, l’écart-type donne une excellente appréciation de la dispersion. 


Figure 7.5 — Effet concentrateur de la diminution de la variance d’une loi normale 


Pour finir, précisons ces notions de dispersion autour de la moyenne à 
l’aide de quelques résultats exprimés en terme de probabilité d'observer une 
valeur s’écartant de la moyenne de plus de  k écarts-types (dispersion rela- 
tive), pour plusieurs valeurs de k 


En effet, soit X une v.a. distribuée selon une loi N (m ; 6). Une valeur x 
qui s’écarte de la moyenne m (dans un sens ou dans l’autre, c’est-à-dire vers 
les valeurs inférieures ou vers les valeurs supérieures) de plus de k fois 
l’écart-type © est caractérisée par l’inégalité : 


Ix— ml >Kko 
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La probabilité cherchée est : 


P(IX-m|>k:0) = P(m > x) = P((Er < 4) (Ex) 


soit, P(IX-m|>E:06) = P(EU < +) + PE > 4) 
[e] [e] 


: X-m , A pee . ie 
La variable étant centrée réduite, sa fonction de répartition est 
(o) 


désignée par Fy. D'autre part, la densité de la loi normale centrée réduite 
étant symétrique par rapport à l’axe vertical, il en résulte que (cf. figure 7.6) : 
Fit k) = PAU <-k)=PU>k)=1-P(U<k)=1-F,;{k) 


—4 2 —k 0 k 2 


Figure 7.6 — Utilisation de la symétrie d’une loi de Gauss 
Ce résultat implique que : 
P(En <4)+ (Em 4) 
(o] (o] 
1 (k)+1-F,(k) = 2(1-F,(k)) 


Nous verrons au $ IL.C la pratique de la lecture des tables. Nous admet- 
trons pour le moment les différentes valeurs de Fy(k) suivantes : 


P(IX - ml >k6) 


k 0,5 1 1,5 2 2,9 3 


Fu) 0,6915 0,8413 0,9332 0,9772 0,9938 0,9937 


224 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


Ceci permet d’obtenir le tableau des probabilités cherchées 


k 0,5 1 1,5 2 2,5 3 


P(IX-m>ko)| 06170  0,3174 01336  0.0456 0,0124  0,0026 


Ces calculs donnent des résultats indépendants de m et de 6 qui peuvent 
être convertis en dispersions absolues pour des valeurs données de © comme 
on le verra également. 


On note ainsi qu’il y a plus de 60 Z des observations issues d’une loi 
N(m : 6) qui s’écartent de la moyenne de plus d’un demi écart-type, mais qu’il 
n’y a que 0,26 % (environ un quart de pour cent) qui s’écarte de la moyenne 
de plus de 3 écarts-types. En particulier pour une loi normale centrée réduite, 
cela signifie que 99,74 % des observations sont comprises entre — 3 et + 3. On 
remarquera encore que plus des deux tiers des observations issues d’une loi 
N'(m ; 6) sont comprises dans l’intervalle [| m — 6 ; m + 6], alors qu’il n’y en a 
plus que 4,56 % (moins de 5 %) à sortir de l’intervalle [m — 26 ; m + 26]. Tous 
ces éléments montrent bien la signification de l’écart-type d’une loi normale en 
termes de concentration des valeurs autour de la moyenne. Ce point est tout à fait 
fondamental pour la pratique des applications (estimations et tests) des calcu Is 
fondés sur la loi normale. 


Pour finir de caractériser la loi de Laplace-Gauss, examinons les deux 
coefficients 7, et y, caractérisant respectivement l’asymétrie et l’aplatissement. 


Puisque y, = _ où les 1, désignent les moments centrés, il s’ensuit 


2 
que y, = 0. Ceci est tout à fait naturel et cohérent puisque ce coefficient vise 


à rechercher les entorses à la symétrie de la distribution. 


Pour le coefficient d’aplatissement, y, = Fs — 3 qui caractérise un degré 


2 
de décroissance aux extrémités de la distribution, le calcul (pour H_ , on pro- 
cède par intégration par parties successives et on obtient pt 4 = 302) 
donne y, = 0. Ce coefficient d’aplatissement a été choisi afin d’avoir, par la 
loi normale, un échelon d’aplatissement relatif à la valeur 0. 

Parmi les propriétés essentielles de la distribution de Gauss, on doit 
retenir : 


La distribution normale est caractérisée par sa symétrie par rapport à la 
moyenne et, moyenne, médiane et mode sont confondus. Les coefficients 
d’asymétrie y, et d’aplatissement y, sont nuls. 
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Une autre propriété de la loi normale est essentielle dans la pratique. 


Propriété 3 


Siona n variables aléatoires normales N° (M; ; 6) et indépendantes , 
alors leur somme suit une loi normale N° (m ; 6). 


On admettra ce résultat qui nécessite le calcul de la densité de la somme 
de v.a. continues indépendantes (produit de convolution, présenté au $ IIL.A). 


D’après ce qui précède, la loi de la somme admet pour paramètres 
respectivement : 


— la somme des moyennes : m = D 


En effet, la moyenne d’une somme de variables aléatoires est toujours 
égale à la somme des moyennes, d’où la valeur de m. D'autre part, les varia- 
bles aléatoires étant supposées indépendantes, la variance de la somme est 
égale à la somme des variances, ce qui montre le second résultat. 


On notera bien que le second paramètre de la somme est la racine carrée 
de la somme des variances. Les variances s’additionnent lorsque les variables 
sont indépendantes!, mais il n’en est jamais de même pour les écarts-types. 


C. Usage des tables 


Deux tables relatives à la loi de Gauss sont utilisées  : la table de la fonction 
de répartition et la table des fractiles (annexes IV). Nous allons les examiner 
dans cet ordre. 


Pour bien comprendre leur généralité, rappelons tout d’abord le point le 
plus fondamental des calculs de probabilités liés à une loi de Gauss 


X mn, Nim:o 8 = na NO:1) 


1. On dit aussi parfois variables orthogonales en référence au théorème de Pythagore de la 
géométrie classique. 
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Par conséquent la probabilité d’un événement lié à X peut toujours 
s’exprimer par la probabilité d’un événement lié à U. Les tables de la loi de 
Gauss centrée et réduite permettent ainsi de calculer les probabilités asso- 
ciées à une loi de Gauss de moyenne et d’écart-type quelconques. 


Tout d’abord examinons les utilisations de la table de la fonction de répar- 
tition de la loi N(0 ; 1). C’est une table à double entrée par laquelle on déter- 
mine la valeur de P(U < u) pour u € [0 ; 3,5] donné. 


On cherche : 
1) la ligne correspondant à la partie entière et au 1 ©’ chiffre décimal de u ; 
11) la colonne correspondant au 2 © chiffre décimal de u ; 


puis à l’intersection de cette ligne et de cette colonne, on lit la probabilité cher- 
chée. 


D Exemple 


Par exemple si U suit une loi N (0 ; 1), on lit directement à l’intersection 
de la ligne correspondant à 0,3 et de la colonne correspondant à 0,08 : 


P(U < 0,38) = 0,6480 


et de même à l’intersection de la ligne portant 1,9 et de la colonne 
portant 0,06 : 


P(U < 1,96) = 0,9750 


Pour une loi normale quelconque X, la procédure est presque identique. Il 
faut simplement se ramener à une loi normale centrée réduite U, selon 


= X-m 
[e] 


L’écart-type © étant strictement positif : 


si{X<a}, alors {X-m<a-—m}et lu-m<e-ml 
© [e] 


a—m 


mais aussi réciproquement si lu < k alors {X <a} 


a—m 


Les événements { X < a} et U < | étant identiques, ils ont la même 


probabilité. On s’est ramené à une lecture de table de loi normale centrée réduite. 
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D Exemples 
Si X suit une loi N(3 ; 2), U = 


PS < 3 <624- " 


= . suit une loi N(0 ; 1) 


P(X < 6,24) = P(U < 1,62) = F,(1,62) = 0,9474 


Si X suit une loi N(- 4:;5), U = _ suit une loi N'(0 : 1) 


P(X < 1,65) = P(S : 1624) 


= P(U< 1,13) = F,(1,13) = 0,8708 

On remarque que la table n’est donnée que pour des valeurs de u (le seuil) 
comprises entre 0 et 3,49. Les extensions sont très simples : 

* pour une valeur u < 0, on utilise la symétrie de la loi normale centrée 
réduite (cf. figure 7.7) : 

Et u)=PU<-u)=P(U>+u)=1-PrU<+u)=1-E,(+ u) 

Par exemple, pour une variable X distribuée selon une loi N(4 ; 2) calcu- 

lons P(X < 2) : 


P(X<2) = PI <- 1) = FD = 1=E, (1) = 011587 


* pour les « grandes » valeurs de |u| (c’est-à-dire au moins égales à 3,5) 
on dispose d’une ligne supplémentaire en bas de table, moins détaillée et 
s’arrêtant à = 4,5. Ceci s’explique par le fait (étudié plus haut au 
$ précédent) qu’une loi de Gauss n’a que moins de 0,30  % de chances de 
s’écarter de plus de 3 écarts-types de sa moyenne. Les probabilités cumulées 
(c’est-à-dire les valeurs de la fonction de répartition) pour des seuils supé- 
rieurs à 3 sont très proches de 1, et varient extrêmement peu. On le constate 
à la lecture de la ligne des grandes valeurs puisque lorsque le seuil passe de 
4 à 4,5, la fonction de répartition a que de 0,00003 environ (alors 
qu’elle augmente de 0,017 entre 2 et 2,5, soit environ 550 fois plus !) ; 

* enfin pour toute valeur de 4 contenant plus de 2 décimales, on fait l’habi- 
tuelle interpolation linéaire. Si U suituneloi N (0 ; 1), la valeur de 
P(U < 1,645) se calcule en remarquant que 1,645 est exactement au milieu 
entre 1,64 et 1,65, valeurs pour lesquelles les probabilités cumulées sont res- 
pectivement de 0,9495 et 0,9505. On prend donc P(U < 1,645) = 0,95 (la 
valeur plus précise est en réalité de 0,94449). 

Prenons un autre exemple, en calculant P(X > 4,94) pour une v.a. X dis- 
tribuée selon une loi N° (-2 ; 4). On écrira : 


P(X>404) = 1-P(X<4 94) = 


- (22 < 4922) 
4 4 


1 P(ILE < 1 735) = 1-F,(1,735) 
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Pour obtenir le résultat, on relève dans la table : 
F(1,73) =0,9582 et F,,(1,74) = 0,9591 
ce qui permet d’obtenir Æ5(1,735) = 0,95865 par interpolation, et 
P(X > 4,94) = 0,04135 

Pour le calcul de la fonction de répartition F,,, il peut être souvent néces- 
saire d’utiliser une formule approchée, comme la formule de Hastings pré- 
sentée à l’annexe II. De nombreux calculs automatiques, par exemple ont 
recours à ce procédé. 

Parmi les autres utilisations de la table de la fonction de répartition de la 
loi de Gauss centrée réduite, on retrouve souvent le calcul de probabilités 
d’intervalles. Ce calcul repose sur la formule établie au chapitre 5, 
P(a < X < b) = F(b) — F(a) dans laquelle F désigne la fonction de répartition 
de la v.a. continue X. 

Prenons l’exemple de la v.a. X distribuée selon une loi N(-3 ; 2) et pour 
laquelle on souhaite connaître  P(— 4 < X < 0). On centre et on réduit au 
niveau des deux inégalités pour obtenir : 


P—4<X<0)=P(-0,5 <U<1,5) 
La probabilité cherchée est égale à : 
ES) - F-0,5) = 0,5) - (A -F,(0,5)) = F5 (1,5) + F(0,5) — 1 
= 0,9332 + 0,6915 — 1 =0,6247 
Tous les autres calculs, comme par exemple ceux de probabilités condi- 


tionnelles reposent de même sur le passage à une v.a. centrée réduite, et éven- 
tuellement sur les formules usuelles du calcul de base des probabilités. 


Ainsi pour une variable aléatoire  X distribuée selon une loi de Gauss 
Na ; 3), on écrira pour calculer P(0<X<2}X >-—2): 


P((0 <X<2) nX>-2)) 


P(0<X<2|X>-2) =  . A 
21 0-1 
F, 2f 
= PH<2)-P(X<0) | y) 
1-P(X<-2) 1-r (2) 
_ F(0,33)-F,(-033) _ 2Æ(033)-1 3 
mere F, (1) : 


On remarquera à ce stade que pour les probabilités d’intervalles, il est 
indifférent de considérer des intervalles fermés, ouverts ou mixtes puisque la 
probabilité d’un point pour une v.a. continue est nulle (comme on l’a vu au 
chapitre 5, $ ILB). 
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Pr (U>u)=1-Pr (U<u) 


—4 <2, —u 0 u 2 
Figure 7.7 - Calcul de probabilité d’intervalles symétriques 
pour une loi de Gauss centrée réduite 


Un calcul très fréquent est celui de P(|U| <u), avec u > 0. Nous sommes 
dans le cas d’intervalles symétriques par rapport à la moyenne ( cf. figure 7.7), 
ce qui revient à chercher : 


P-u<U<+u)=P(U<+u)-P(U<-u),or P(U<-—u)=1-P(U <u) 
On a le résultat : P(|U|<u) = 2P(U<u)-1 = 2F;(u)-1 
Par complémentarité, on obtient également : 
P(|U|>u) = 1-P(|U| <u) = 2[1-F,(u)] 
P(|UI < 1,96) = 0,95 
P(|U] < 1,645) = 0,90 


On peut retrouver ainsi quelques caractéristiques utiles de toute distribu- 
tion normale. 


Par exemple : 


Si X suit une loi normale N (m ; 6), en donnant à u successivement les 
valeurs 1, 2 et 3, on trouve que la probabilité que 


° X s’écarte de sa moyenne d’au plus 1 écart-type est 
2 - 0,8413 — 1 = 0,6826 

° X s’écarte de sa moyenne d’au plus 2 écarts-types est 
2: 0,9772 — 1 = 0,9544 

° X s’écarte de sa moyenne d’au plus 3 écarts-types est 
2 + 0,9987 — 1 = 0,9974 


On pourrait aussi présenter ces résultats sous la forme ( cf. figure 7.8) : 


— il n’y a que 31,74 % des observations d’une loi normale qui s’écartent 
de la moyenne de plus de 1 écart-type ; 
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—il n’y a que 4,56 % des observations d’une loi normale qui s’écartent de la 
moyenne de plus de 2 écarts-types ; 


— il n’y a que 0,26 % des observations d’une loi normale qui s’écartent de 
la moyenne de plus de 3 écarts-types. 


2,28 % (= 4,56 % /2) 15,87 % (= 31,74 % /2) 


Figure 7.8 — Dispersion de la loi normale 


Dans ce domaine gaussien, la valeur 1,96 est à retenir, car elle correspond 
à 95 % des observations, ou par complémentarité, 


Il n’y a que 5 % des observations qui s’écartent de la moyenne de plus 
de 1,96 fois l’écart-type. 


La troisième table relative à la loi de Gauss est celle des fractiles. 

Rappelons tout d’abord qu’on appelle fractile d’ordre oo (0 < & < 1) pour 
une distribution de fonction cumulative F, la valeur x, telle que F(x,) = 

C’est donc la valeur seuil x, telle que sur l’ensemble ]- ce ; x[, on accumule 
une probabilité ©. 


Il est conventionnel, nous l’avons déjà mentionné, de désigner par  U la 
loi normale centrée réduite, et par conséquent, on note u, le fractile d’ordre 
(0 < & < 1) pour cette répartition N (O ; 1). 

L'utilisation de cette table des fractiles présente une particularité : on peut 
avoir à la lire de deux façons différentes. En effet, la probabilité © pour 
laquelle on cherche le fractile se lit soit : 


— sur la colonne de gauche (2 premiers chiffres décimaux de @) et la ligne 
supérieure (3° chiffre décimal de @) si & < 0,5 


— sur la colonne de droite (2 premiers chiffres décimaux de ©) et la ligne 
inférieure (3° chiffre décimal de ©) si &œ > 0,5 


LES PRINCIPAUX MODÈLES STATISTIQUES CONTINUS e 231 


Il suffit de prendre alors la valeur à l’intersection de la ligne et de colonne 
déterminées, en l’affectant : 

° du signe + si &œ > 0,5 

° du signe — si & < 0,5 

Donnons quelques exemples d’application pour une loi de Gauss centrée 
réduite : 

* le fractile d'ordre 0,010 est égal à wo, = — 2,3263 

° le fractile d’ordre 0,950 est égal à 995 = + 1,6449 (on peut comparer ce 

résultat à celui obtenu plus haut dans ce même paragraphe, dans un exem- 

ple d’interpolation linéaire) 

* le fractile d’ordre 0,250 (premier quartile) est égal à w925 = — 0,6745 

+ le fractile d’ordre 0,750 (troisième quartile) est égal à 4075 = + 0,6745 

La comparaison de ces deux derniers fractiles fait bien sûr ressortir la 
symétrie de la loi. 

Notons encore deux fractiles qui jouent un grand rôle en statistique 
décisionnelle : 

Upo15s = + 1,96 et  u5995 = + 2,5758 

Si on s’intéresse à une v.a. X de loi normale quelconque Nm ; 6), on 

obtiendra le fractile x,, d’ordre ot, par : 


a = P(X<x,) = (Er nan) = Fy (=) 
G © G 


 Xa-mM , : : : ; , 
la quantité — étant le fractile u,, d’ordre & d’une loi de Gauss centrée 
réduite. 


a 


_—— A, mm 
On peut écrire u,, = , SOit Xy = M + Ug * & 
[eo] 


Ainsi par exemple, le fractile d'ordre 0,675 pour une loi N(2:0,5) 
s’obtient à partir du fractile d’ordre 0,675 de la loi de Gauss centrée réduite 
lu sur la table, soit 9675 = 0,4538, et vaut : 

2+0,5 - 0,4538 = 2 + 0,2269 = 2,2269 
Par la même méthode, le fractile d’ordre 0,333 pour une loi N (-1 ;2) vaut : 
—1+2:(-0,4316) = - 1,8632 

Dans le premier cas, 32,5 % des observations issues d’une population distri- 
buée selon une loi N° (2 ; 0,5) sont supérieures à 2,2269. Dans le second cas, on 
peut constater qu’il y a une chance sur trois d’obtenir une observation tirée dans 
une population distribuée selon une loi NE-152) qui soit inférieure à — 1,8632 

Ces calculs de fractiles sont particulièrement utiles pour l’obtention 
d’intervalles de confiance et la réalisation de tests. 


232 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


Enfin, nous mentionnons l’existence (et l’utilisation) de la table dite de l’écart- 
réduit. Elle permet de lire les quantités P(|U| > u), autrement dit les probabilités 
pour qu’une gaussienne s’écarte de sa moyenne de plus de u fois son écart-type. 


Cette table présente un intérêt limité, car elle nécessite quelques calculs 
complémentaires dès lors que l’intervalle auquel on s’intéresse n’est pas 
symétrique autour de la moyenne. De plus on sait que 


P(UT<u) = 2(1-F;(u)) 


et ces probabilités sont en fait immédiates à obtenir à partir de la table de la 
fonction de répartition sans justifier de table supplémentaire. 


D. Abord statistique de la loi normale 


On a vu dans le paragraphe précédent que pour une variable normale, 
moyenne, médiane et mode sont confondus, et que la répartition est totale- 
ment symétrique par rapport à cette valeur. 


Cette propriété essentielle est souvent utilisée devant des données obser- 
vées pour poser une hypothèse de normalité c’est-à-dire pour envisager un 
modèle fondé sur une loi normale. 


C’est donc à partir de l’examen de l’histogramme des données recueillies 
et de ses caractères de symétrie que l’on peut rechercher un modèle gaussien. 
Dans ce cas, on prendra tout de même bien soin de vérifier quelques carac- 
téristiques de la dispersion des données pour avoir une appréciation plus 
complète. Pour cela, on examinera le pourcentage des observations qui 
s’écartent de la moyenne de moins d’un écart-type et de moins de deux 
écarts-types, et on comparera ces pourcentages aux valeurs théoriques qui 
seraient obtenues si les observations étaient purement gaussiennes, c’est-à- 
dire respectivement 68,26 % et 95,44 %. Très grossièrement, on recherche 
des pourcentages pas trop éloignés de 70 % et de 95 %. 


Toutefois, même lorsque des données vérifient à la fois la symétrie et 
cette propriété de dispersion, on ne peut conclure qu’à une apparence de 
normalité (plus ou moins approximative selon les entorses à la symétrie et 
aux pourcentages de dispersion). II s’agit là, comme ce qui a été présenté 
pour la loi de Poisson ou la loi exponentielle, d’une méthode pragmatique 
visant à reconnaître grossièrement un contexte possible de loi de Gauss. 


Le diagramme quantile-quantile, présent dans la plupart des logiciels sta- 
tistiques et très facile à construire avec un tableur muni de possibilités de 
représentations graphiques, permet une appréciation graphique de la concor- 
dance entre une distribution observée et un modèle théorique. Dans ce gra- 
phe, l’axe des ordonnées porte les fractiles de la distribution observée, tandis 
que l’axe des abscisses porte les fractiles correspondants de la loi théorique. 
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Le nuage des points s’aligne sur la première bissectrice lorsque la distribu- 
tion théorique proposée est une bonne représentation des observations. On 
doit remarquer que l’appréciation de l’alignement des points le long de la 
bissectrice peut être considérée comme subjective. Toutes les déviations par 
rapport à l’alignement (extrémités présentant une courbure, points éloi- 
gnés.…) peuvent être repérées et analysées. En cas d’alignement, le type de 
modèle est alors retenu, et il reste à apprécier ses paramètres par une éven- 
tuelle translation et/ou inclinaison par rapport à la première bissectrice 

— un alignement sur une parallèle à la première bissectrice fera évoquer 

une erreur sur le choix de la caractéristique de position (moyenne...) de 

la distribution théorique ; 

— un alignement sur une droite passant par l’origine mais inclinée par rap- 

port à la première bissectrice évoquera une erreur sur la caractéristique de 

dispersion (écart-type...) ; 

— un alignement sur une droite ne passant pas par l’origine et inclinée par 

rapport à la première bissectrice évoquera une erreur sur le choix des 

caractéristiques de position et de dispersion. 

Prenons comme illustration l’exemple suivant. Un magasin désire adapter 
ses produits à sa clientèle, et pour cela, étudie le nombre de clients selon l’âge, 
à partir d’un échantillon de 100 clients. On a obtenu la répartition suivante 


Âge <20 [20-25[ [25-30[ [30-35[ [35-40[ [40-45[ [45-50[  >50 
DORE 8 10 13 17 22 11 12 s. 
de clients 


Peut-on accepter une hypothèse de normalité pour l’âge des clients avec 
une moyenne 35 et un écart-type 10,5 ? 


On calcule pour la borne supérieure de chaque classe le quantile théorique 
d’une loi normale centrée réduite correspondant à la fréquence cumulée observée, 
et on déduit le quantile théorique correspondant à la loi normale N(35 ; 10,5). 


Quantile observé x; 20 25 30 35 40 45 50 
Fréquence cumulée F; 0,08 0,18 0,31 0,48 0,70 0,81 0,93 
Quantile théorique N(0 ; 1) —1,4051 -09154 -0,4959 -0,0502 05244  0,8779 14758 
Quantile théorique N(35 ; 10,5) 20,25 25,39 29,79 34,47 40,51 44,22 50,50 


Appelons u; et x;, les quantiles théoriques N(0 ; 1) et N(35 ; 10,5) cor- 
respondant au i* quantile observé x; 


À partir du quantile uw; telque Fy(u;) = F,,on calcule le quantile x; : 
x; = 10,5-u; +35 
Puisque les points ( x; , x;) sont à peu près alignés le long de la première 
bissectrice (cf. figure 7.9), l’ajustement par la loi normale N (35 ; 10,5) est 
retenu. 
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C2 Œ fe =LOI. NORMALE. STANDARD.INVERSE(E2) 


il x; F; Li > 

En 0,08 [ -1,4051 l 20,25 55 

3 25 0,18 -09154 | 25,39 50 

4 30 0,31 -0,4959 | 29,79 Ë 45 

5 35 0,48 -00502 | 3447 5 40 

6 40 0,7 0,5244 | 40,51 re 

4 45 0,81 08779 | 4422 Ë 

8 | 50 0,93 14758 | 50,50 LE 

g 25 

10 20 

11 20 25 30 35 40 45 50 55 
12 Quantile théorique 
13 

44 


Figure 7.9 - Diagramme Quantile-Quantile 
d’une répartition observée sensiblement normale 


Notons que le diagramme Quantile-Quantile ne s’ applique pas seulement 
pour un modèle gaussien. On peut tracer un diagramme Quantile-Quantile 
pour un ajustement par une loi continue dont la fonction de répartition est 
strictement croissante, c’est-à-dire une loi dont la fonction de répartition est 
bijective sur l’intervalle correspondant à des valeurs non nulles de la fonction 
de densité et ne présentant pas de « trous »1. 


Nous en montrerons l’application pour la loi log-normale ($ IV.A) et pour 
la loi de Pareto ($ IV.B). 


Le diagramme Quantile-Quantile s’utilise aussi pour comparer deux séries 
d'observations. 


E. Abord probabiliste de la loi normale 


C’est comme loi approchée qu’il est fait l’usage le plus habituel de la loi 
normale : 
* soit on la retient pour des arguments statistiques tels que ceux évoqués 
au paragraphe précédent ; 
* soit on remplace la distribution réelle (qui peut être connue ou inconnue) 
par une distribution gaussienne lorsqu'elle est une bonne approximation. 
Cette recherche du recours à une loi de Gauss est guidée par deux 
considérations : 
— d’une part, les calculs relatifs à des gaussiennes présentent une grande sim- 
plicité (notamment en raison de la symétrie) ; 


1. Goldfarb B., Pardoux C., « Comment faire les diagrammes Quantile - Quantile ( Q — Q)et 
Probabilité — Probabilité (P — P) ? », La Revue de Modulad, n° 33, juillet 2005 (www.modulad.fr, 
« Excel’Ense »). 
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— d'autre part, des résultats (dits asymptotiques) qui seront abordés ultérieure- 
ment donnent à de nombreuses v.a. particulières des lois sensiblement gaussiennes 
dès lors que leur application est fondée sur de très grandes séries d’observations. 


Très concrètement, on peut être conduit à poser une hypothèse de norma- 
lité dans trois grandes situations. 


1) Lorsqu'on a construit un schéma binomial où n > 50 et p compris entre 
0,4 et 0,6 , on approxime (pour les calculs) par une loi normale N (np ; Jnpq). 
La condition npgq > 18 est quelquefois utilisée dans un souci de simplicité. 


11) Lorsqu'on a un modèle de Poisson dont le paramètre m est supérieur à 
25, on approxime (pour les calculs) par une loi normale Nm; /m). 


Dans ces deux cas, la justification rigoureuse de l’approximation nécessite la 
connaissance de certaines formules d’analyse mathématique, telles que la for- 
mule de Stirling. Nous les admettrons sans démonstration. Quelques illustrations 
de ces approximations et de leurs limites sont données aux figures 7.10a et 7.10b. 


ii) La somme de n variables aléatoires indépendantes, suivant la même loi, 
de moyennes m et d’écarts-types © suit approximativement une loi normale dont 
la moyenne est la somme des moyennes, et l’écart-type est la racine carrée de la 
somme des variances, et ce dès que n est assez grand, soit en pratique n > 30 


L’approximation de la loi binomiale par la loi normale en est un cas par- 
ticulier de cette dernière situation puisqu’une v.a. binomiale est la somme de 
v.a. de Bernoulli. 

Ce résultat joue un rôle essentiel dans toute la statistique classique. Sa 
démonstration est en dehors du cadre de ce livre. 


Théorème central-limite (ou de la limite centrale, ou encore de la limite centrée) 


X;,i=1,2,..., n, V.a. indépendantes, de même loi, 
de moyenne m, d’écart-type & 


D L  N(O: /») 


Insistons sur la nécessaire existence de m et de 6 pour l’utilisation de cette 
forme du théorème central-limite, inapplicable sinon (loi de Cauchy, $ 3.2). 


Ce théorème a été étendu à la convergence en loi de variables aléatoires 
n’ayant pas la même distribution (donc avec des moyennes et des variances 
différentes, mais cependant toutes finies), sous la condition dite de Linde- 
berg, exprimant que les variables 


im; 


sont « très petites » en probabilité 
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Sous cette dernière forme, on peut alors interpréter la loi de Gauss 
comme la loi approximative des phénomènes résultant d’un grand nombre 
de « petites » causes indépendantes, et qui s’additionnent, sans qu’aucune 
de ces causes ne soit prédominante. Cette apparente généralité fait postuler 
trop souvent une hypothèse de normalité, en fait par défaut d’information 
(et/ou d’analyse) sur les causes d’un phénomène que l’on cherche à 
étudier. 


0,09- 0,09- 

0,081 %(100 ; 0,4) 0,084 (100 : 0,4) 

0,07- KL 0,07- 

0,06- 0,06- N(40 ; 4,9) 
0,05- 0,05 + 

0,04- 00) 0,04- 

0,03- 0,03- 

0,02- 0,02- 

0,01 - 0,01 + 

0,00 0,00 

01e, (100 ; 0,25) 0,107 (100 ; 0,25) 

0,09 + 0,09 + 

0,08 — N 0,08 < 

0,07 - 0,07 - 

0,06 + P(25) 0,06 - N(25 ; 4,33) 
0,05 + «TT 0,05 + a TT 

0,04 0,04 + 

0,03 0,03 - 


0,02 - 0,02 - 
0,01 - | | 0,01 - 
0,00 0,00 

Figure 7.10a — Approximations correctes par la loi de Gauss, incorrectes par la loi de Poisson 


Notons encore qu’un domaine d’application particulier de la loi nor- 
male par cette dernière approche est l’étude de la variable aléatoire 


XI +X,+..+X, 
n 


a 


n 


qui, lorsque les variables X; sont toutes de même loi et indépendantes |, 
porte le nom de moyenne empirique. 


1. On parle alors de variables indépendantes et identiquement distribuées (soit i.i.d. en abrégé). 
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0,14- (100 : 0,1) 0,14- 


0,12 + lt 0,12 
0,10 - : 0,10 — 
0,08 - | p(10 0,08 - 
-7H0 
0,06 0,06 
0,04 - 0,04 - 
0,02 - 0,02 - 
0,00 Fe 0,00 
0,20 - 0,20 - 
: ; . 207 (100 : 0,05 
018. (100: 0.05) 0 18- ( ) 
0,16 — | 0,16 — 
0,14 + . H 0,14 + 
0,12 + 0,12 + 
0,10 - PS) 0,10 - 
0,08 + 0 0,08 + 
0,06 — 0,06 — 
0,04 0,04 + 
0,02 — [n 0,02 — 
0,00 en 0,00 


Figure 7.10b — Approximations incorrectes par la loi de Gauss, correctes par la loi de Poisson 


L’ensemble des variables X; caractérise n individus extraits d’une même 
population ; on l’appelle n-échantillon extrait de cette population. Dans ce 
contexte, X, désigne la moyenne cet échantillon, mais au sens aléatoire, 
c’est-à-dire compte tenu des fluctuations d’échantillonnage . La moyenne 
empirique d’un échantillon dès lors que sa taille est assez grande (en pratique 
n > 30) suit à peu près une loi normale. 


Ce résultat est d’une application extrêmement courante et montre déjà que 
le recours à la loi de Gauss est très classique pour des raisons qui mêlent, tout 
à la fois, les arguments statistiques et les arguments probabilistes. Les lois 
présentées au paragraphe suivant sont ainsi les lois fondamentales de l’uni- 
vers gaussien. 


De tout ce qui précède, on peut dresser le diagramme de la figure 7.11 qui 
résume les diverses approximations envisagées et montre bien la position clé 
de la loi de Gauss dans la modélisation de l’aléatoire, justifiant le terme sou- 
vent utilisé de statistique gaussienne. 
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La suite de ce chapitre (et notamment les lois du khi-deux, de Student, 
et de Fisher-Snedecor) relativisera légèrement cette apparence. On ne doit 
pas conclure à tort qu’un phénomène est gaussien en raison des multiples 
approximations. Nous avons déjà vu par exemple que la loi binomiale 
D ; p) où n = 100 et p = 0,05 peut être approximée par une loi de Pois- 
son de paramètre 5, et non pas par une loi de Gauss. Le dernier paragraphe 
de ce chapitre montrera plusieurs distributions de probabilité correspon- 
dant à des situations typées non gaussiennes. L’une d’elles, la loi de 
Pareto, définit un contexte probabiliste (univers parétien) différent de celui 
de la loi de Gauss. 


On fera enfin particulièrement attention à ne pas donner le sens commun 
du mot « normal » pour une population distribuée selon une loi de ce type, 
cette interprétation étant le plus souvent admise en même temps que la géné- 


ralisation abusive citée ci-dessus. 
n>50etp<0,1 a» 


n > 50 et 0,4 <p <0,6 
ou npq >18 (N{np ; Vnpg) 


Moyenne empirique X,, n >30 
Somme de n v.8. i.i.d. | Théorème central-limite 


Figure 7.11 — Synthèse des approximations par la loi de Gauss 


F. Correcion de continuité 


Une difficulté se pose lors de l’approximation d’une loi discrète (binomiale 
ou Poisson par exemple) par la loi normale qui est continue. En effet, les 
probabilités sont concentrées en des points pour la loi discrète, alors que la 
loi normale affecte la probabilité 0 à tout point. Si on a une loi (100 ; 0,4), 
comment calculer P(X = 50) à partir de la loi normale ? 


L’approximation normale est ici totalement justifiée (c’est même un des 
meilleurs cas !). Cette probabilité P(X = 50) a une valeur exacte, difficile à 
calculer (dépassement de capacité), égale à 0,0103 ; la loi binomiale, la loi 
continue, lui affecte une valeur nulle ! 


On pallie cette difficulté par une correction dite « de continuité », de la 
façon suivante. 
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Si X est une variable discrète qu’on approche par une loi normale 
Nm : o), place la valeur k dans un intervalle symétrique et de largeur unité, 
et on pose : 
P(X=k) = P(k-05<X<k+0,5)= F (Sr) ge) 
6 6 


Ainsi par exemple, dans le cas de la loi (100 ; 0,4), approximée par la 
loi N'(40 ; 4,9) 


P(X = 50) = Fy(+ 2,14) - Fy(+ 1,94) = 0,01 


alors que la valeur exacte calculée par la formule des probabilités binomiales 
est 0,0103 


La formule présentée pour ce calcul n’est à utiliser que si le calcul par la 
loi exacte est trop délicat. Enfin, on doit noter que ce mode de calcul n’a de 
sens que pour obtenir des probabilités de loi discrète par des calculs appro- 
chés utilisant la loi normale. 


LR Les lois dérivées de la loi normale 


A. L: loi du khi-deux 


Si on dispose de n v.a. {X;, i= 1, 2..., n} indépendantes et de même loi de 
Gauss N (m ; O), alors la variable aléatoire appelée moyenne empirique 
n 


X. 


L 


x, == suit une loi N(m:; ©) 
n n 


et caractérise « la moyenne » des X;. Cette moyenne empirique permet de jus- 
üifier plus encore l’utilisation de la loi de Gauss. 


Dans le même contexte de gaussiennes indépendantes et de même loi, la 
v.a. Q définie par 


Ÿ X-m? 


Q = = 


O2 
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joue aussi un rôle essentiel. Pour des réalisations { x;,i=1,2,..., n} de ces 
variables X;, la variable aléatoire Q prend la valeur 
n n 


Y'G-m) YG-m) 


i=i nm i=1 n's, 


6? 7 ©? n 7 ©? 


dans laquelle on reconnaît la variance s? 


de la série des réalisations. Au fac- 


teur multiplicatif près 2 , la variable © va décrire les réalisations de la 
© 


variance des observations. 


Ce rôle de caractéristique de la variance des observations est historique- 
ment! celui qui a conduit à son étude détaillée. Cette v.a. Q peut aussi 
s’écrire : 


Ÿ &-m) 2 


ds = es |Xi-m 


O2 , (eo) 
tel 


c’est-à-dire comme somme de 7 carrés de v.a. gaussiennes centrées réduites 
indépendantes. C’est cette distribution qu’on étudie sous le nom de loi dukhi- 
deux à n degrés de liberté, notée y? (n). Elle apparaît comme étroitement liée 
à l’étude de la variance. Dans ce paragraphe, nous présentons seulement la 
distribution du khi-deux, ses propriétés essentielles, la pratique des calculs, 
et sa place fondamentale dans l’ensemble des méthodes statistiques. 


Définition 
Si X est une v.a. distribuée selon une loi N (m ; 6), alors la loi de la 


2) 
V.a. (er) est dite loi du khi-deux à 1 degré de liberté , notée y?(1) 


Propriété 
La densité de probabilité d’une loi %2(1) est donnée par : 


1 e-*/2x-1/2 
N2T 


0 SO 


si x>0 


1. Par le mathématicien, probabiliste et démographe français I. J. Bienaymé (1796-1878) entre 
1838 et 1852. 
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En effet, si Q suit une loi 42(1), on peut écrire Q = U?2 où U est une va. 
normale centrée réduite. On écrit la fonction de répartition de Q comme suit : 


e°2dt 


+ x 
1 

F(x) = P(U2< x) = P(|U|< x) = | — 
+, /x I x l 
J ——et"ldt- | —e""?dt 
SNeR SNA 

La dérivée de cette dernière expression par rapport à x donne la densité 
cherchée : 


Jo (x) = 8 _. + 1, _. 
Vin 24x V2r  24x 
= L = 1 io, 


N2nx  V2n 


Bien entendu cette dernière expression est valable si x > 0. Compte tenu 
du fait que Q est un carré, l'événement Q < x est impossible si x <0, ce qui 
implique f,(x) = 0 si x <0 

Nous avons vu au chapitre 6 comment obtenir la loi d’une somme de deux 
v.a. discrètes indépendantes. Dans le contexte des v.a. continues, on admettra 
le résultat suivant. 


Théorème 


Si X et Ÿ sont deux v.a. absolument continues indépendantes, de 
densités respectives f,(x) et g,(y), alors la densité de probabilité de la 
somme Z = X + Y est donnée par : 


co 


ha) = [RG -8G-nd = [ef G-»)dy 


Es 


Cette expression qui lie les densités f,(x) et g,(y) des v.a. X et Y est appelée 
produit de convolution de f, et g, 


Appliquons ce résultat à la somme des v.a. X et Y indépendantes et suivant 
chacune une loi #?2(1): 


À 6,5 si 
fQ) = {27 


0 si x<0 
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1 
e2y-12 : 0 
y> 
8r(y) = À 27 
0 si y<0 
Ces résultats permettent d’obtenir la densité de la somme Z de deux v.a. 
distribuées selon des lois : 


hz(2) 


JL fre = x}-e-&-224dx 
2T dl 


Z 


1/2 


— 1 —z/2 ( _ 
= 2x° Je x)| dx 


: À ( 1 ) a 
md [UC | dt 


La dernière intégrale a été obtenue avec le changement de variable 
x=2:1t,etle calcul usuel donne la valeur 7. La première intégration se fait 
entre 0 et z puisque f(x) = 0 si x < 0 et g,(z — x) = 0, si z — x < 0, soit si x > z. 
La densité de la somme Z est donnée par : 


I 

et si > 0 
hz(2) = 12 : 

0 si Zz<0 


Cette dernière expression n’est autre que la fonction densité de la loi 
exponentielle de paramètres 0 =0 et À = 2. 

En tenant compte du fait que I'(1) = 1 et que z° = 1, on peut écrire la den- 
sité de Z pour z > 0 sous la forme ! : 


1 _— F 
ZT) le pour &« = 1 
Cette formule : 
nr. 1e-x2 ï +s0 
f(x) = {2°T (0) 
0 si x<0 


1. Il est particulièrement utile de se servir dans ce chapitre, de la fonction gamma, définie en 


tout point x>0 par L(x) = fred avec r{;) = x, (x) = (x-1)T(x-1) 


et Mn) = (n-1) 
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représente d’une part, lorsque = 1/2, la densité de la loi %?(1), et d’autre 
part, lorsque & = 1, la densité d’une somme de deux lois %2(1) 

On peut montrer plus généralement pour toute valeur de « que cette for- 
mule donne la loi d’une somme de 2 @ v.a. distribuées selon des lois %2(1) 


Ceci explique que, par extension, on appellera  %2(n) la loi suivie par la 
somme de n carrés de variables aléatoires gaussiennes centrées réduites indé- 
pendantes. La densité de cette loi %?(n), dite loi du khi-deux à n degrés de 
liberté (ddl en abrégé), est donnée par la formule ci-dessus avec ot = n/2 


Pour une v.a. X suivant une loi %2(1 ), il est très aisé d’obtenir les deux pre- 
miers moments, puisque X = U? où U est une v.a. gaussienne centrée réduite : 
E(X) = E(U?) = var(U) + E(UY = 1 

De même, on peut écrire : 

var(X) = E(X2) - E(X) = E(U*)-1=3-1=2 

Ces résultats se généralisent tout de suite au cas d’une loi X2(n) 
puisqu’une telle distribution est la somme de n v.a.i.i.d. de loi %?2(1). Par 
conséquent, pour une v.a. Ÿ de loi 4?(n), on a : 

E(Y)=n et var(Y)=2n 

Cette loi est une loi asymétrique, qui coïncide avec la loi exponentielle 
pour &= 1, c’est-à-dire pour 2 dd. 

On peut calculer les caractéristiques de forme : 


8 12 
Viz OO € Y= |— 
n n 


montrant bien l’asymétrie, mais aussi la tendance ( cf. infra) vers une loi 
symétrique (la loi normale) lorsque le nombre de degrés de liberté augmente. 
De façon tout à fait évidente, ces deux coefficients tendent vers la valeur 0 
qu’ils prennent pour une loi de Gauss. 


La figure 7.12 donne la forme des distributions X2(n) pour quelques 
valeurs de n. 


1,2 
1,0 
0,8 
0,6 
0,4 


0,2 


0 3 6 9 12 15 
Figure 7.12 - Densités de quelques lois de khi-deux (à 1,2, 4 et 8 ddl) 
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On remarque sur cette figure que, pour 1 ddi, la densité se comporte en 
1/,/x au voisinage de x = 0, et qu’elle décroît exponentiellement vers 0. Pour 
2 dd, il s’agit de la densité de la loi exponentielle de paramètres 6=0 
et À = 2. En dehors de ces deux cas particuliers, toutes les courbes partent de 
l’origine (d’autant moins rapidement que le nombre de ddl est élevé), elles 
présentent un maximum et décroissent lentement vers 0. Il faut noter que plus 
le nombre de ddl est élevé, plus la dissymétrie est atténuée. La loi du  %?(n) 
étant la loi d’une somme de n va. i.i.d. (de loi %2(1) commune), le résultat 
évoqué au $ ILD, indiquant que la loi d’une somme de v.a. 1.1.d. peut être 
approximée par une loi de Gauss, montre bien que la loi du khi-deux à n ddl 
tend à se comporter comme une loi de Gauss lorsque n devient grand. 


Cette relation entre la loi du khi-deux et la loi normale est traduite numé- 
riquement par la formule de Wilson-Hilferty : 


P(Xn)<x)=Fy () ne. 2), fe) 


reliant la fonction de répartition de la loi  #%?(n) à celle de la loi de Gauss 
centrée réduite qui est tabulée. Cette formule est une excellente approximation 
dès lors que le nombre n de ddl n’est pas trop petit (en pratique dès quen > 10). 


Une autre possibilité de calculs approchés pour la fonction de répartition 
de la loi %?(n) est donnée par la formule de Fisher : 


PGE(n) < x) = Fy (2x - J2n -1) 


plus simple, mais donnant une moins bonne approximation. On ne l’utilise 
que pour ñn > 30 


Enfin la loi du khi-deux à 2 n ddl présente une relation très intéressante 
pour les calculs avec la loi de Poisson. Si X suit une loi 4?(2n), et si Y suit 
une loi de Poisson de paramètre x, alors : 


P(X>2x) = P(Y>n-1) 


La figure 7.13 met bien en évidence l’allure dissymétrique de la courbe géné- 
rale (c’est-à-dire pour n > 2), tant que le nombre de ddl n’est pas trop élevé. 


Pour les calculs relatifs à la loi du khi-deux on dispose essentiellement de 
la table de fractiles (annexe IV). Cette table est à double entrée. Dans la 
colonne de gauche, on recherche la ligne correspondant aux degrés de liberté 
de la loi étudiée et dans la ligne supérieure, on recherche la probabilité 
cumulée © qui définira le fractile, noté 44(2n).Donnons quelques exemples : 


20505) = 4,351 | 595010) = 18,307]  L6o1(8) = 1,64 | X090(6) = 16,812 


295(30) = 29,336 | X695(40) = 55,76 | %501(40) = 22.16 | X699(30) = 50,892 
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0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 


Figure 7.13 — Dissymétrie de la loi du khi-deux 


La formule classique P(a < X < b) = F(b) - F(a) permet de déterminer 
des probabilités d’intervalles à condition de disposer d’une table des frac- 
tiles assez détaillée. Dans le cas contraire, on peut recourir à des interpola- 
tions linéaires. Cependant, il vaut mieux éviter autant que possible cette 
dernière méthode et privilégier par exemple la formule de Wilson-Hilferty. 


Donnons-en un exemple. Soit X une v.a. distribuée selon une loi de khi- 
deux à 25 ddi, et soit à calculer P(14<X<39)=P(X<39) - P(X< 14) 
Aucun des deux seuils ne se trouvant dans la table des fractiles, utilisons la 
formule de Wilson-Hilferty : 


PO2(25)<14)<E, 1(C) ne. ) Ds | = F,(-1,770) 


25 225/\) 2 
2 F 2) L >) 25| _p% 
P(42(25) < 39) QE 1Re> ; 1 (1,789) 


On obtient 0,925 comme valeur approximative par lecture de la table de 
la loi de Gauss. 

Mentionnons pour finir, une propriété qui découle (comme dans le cas de 
la loi binomiale) directement de la définition concrète (somme de carrés de 
gaussiennes centrées réduites indépendantes) de la loi du khi-deux. 


Si X et Y sont deux v.a. indépendantes distribuées selon des lois de khi- 


deux respectivement à #7, et n, ddl, alors la v.a. Z = X + Y est distribuée 
selon une loi #?(n; +n:) 
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B. L: loi de Student 


Définition 


Si U et Y sont deux v.a. indépendantes suivant respectivement une loi 
N(0 ; 1)etune loi X2(V), on dit que le quotient 


Ten 


F NY 
V 


suit une loi de Student! à v degrés de liberté (ddl). On la note T,, 
On peut montrer que la densité de la v.a. 7, est donnée par : 
1 
r(° + ) , 
Po = LE) 
MALE r{ 3 v 


Il s’agit donc d’une densité symétrique par rapport à l’axe des ordonnées. 
On en déduit que T, est une v.a. centrée : 


E(T,) = 0 
Le calcul de la variance, ici égale à Æ(T?), donne pour v > 2 : 
V 
var(T,) = —— 
M) = À 


Lorsque v = 1 ou v = 2, la loi de Student n’admet pas de variance finie. 


La loi de Student à 1 ddl est assez particulière. En effet, elle correspond au 
quotient de deux gaussiennes centrées réduites indépendantes puisque le dénomi- 
nateur est la racine carrée d’une loi %2(1), c’est-à-dire la racine du carré d’une 
gaussienne centrée réduite. Cette loi 7; porte aussi le nom de loi de Cauchy. 


Sa densité s’écrit : L — . Elle est représentée sur la figure 7.14, en 


T l+1 
comparaison avec la loi de Gauss centrée réduite, par rapport à laquelle elle 


présente des queues de distributions très épaisses. 


1. Student était le pseudonyme choisi par le statisticien William Sealy Gosset (1876-1937). Il 
fut l’un des premiers statisticiens du monde de l’entreprise, consacrant sa carrière à l’industrie 
agro-alimentaire (brasseries) au sein de laquelle il a toujours été reconnu à la fois comme 
industriel et comme scientifique. Très associé aussi au monde universitaire, il a largement 
contribué au développement scientifique de cette période. 
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— 8,5 2,5 =1;5 — 0,5 0,5 1,9: 2,5 8,5 
Figure 7.14 — Loi de Cauchy et loi de Gauss centrée réduite 


Cela est encore plus évident si on compare la loi de Cauchy à la loi de 
Gauss centrée qui possède le même maximum, soit 0,3183, ce qui correspond 
à un écart-type égal à 1,2533. Dans cette comparaison, représentée figure 
7.15, on voit que la probabilité qu’une v.a. de Cauchy dépasse la valeur 1 est 
égale à 0,25 (1 est ainsi le troisième quartile, et par symétrie —1 est le premier 

uartile de la loi de Cauchy), alors que la probabilité qu’une v.a. de Gauss 
(0 ; 1,2533) dépasse la valeur 1 est égale à 0,213. De même, la probabilité 
qu’une v.a. de Cauchy dépasse la valeur 2 est égale à 0,1476, alors que pour 
la v.a. N'(0 ; 1,2533), cette probabilité est égale à 0,055 


Cette loi de Student à 1 ddl, ou loi de Cauchy, présente la particularité de 
n’avoir aucun moment fini autre que son espérance mathématique (qui est nulle). 
On retiendra que cette situation n’est pas du seul domaine de la théorie, mais 
qu’elle correspond au rapport de deux gaussiennes centrées réduites indépendantes. 


Cauchy 
— — — N(0;1,2533) 


— 8,5 — 2,5 —1,5 — 0,5 0,5 1,5 2,5 3,5 


Figure 7.15 — Loi de Cauchy et loi N(0 ; 1,2533) : comparaison des aplatissements 
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Dans le cas général de la loi de Student à v ddl, nous avons vu que la 
moyenne est nulle, que la variance est supérieure à 1 et se rapproche de cette 
valeur au fur et à mesure que v augmente. On a représenté sur la figure 7.16, les 
densités des lois de Student à 1, 2, 5 et 15 ddl ainsi que la densité de la loi de 
Gauss centrée réduite. Il apparaît clairement sur cette figure que la loi de Student 
devient très proche de la loi N(0 ;1) lorsque son nombre de ddl augmente. En 
pratique, cette approximation est de bonne qualité dès lors que v > 40 


Figure 7.16 — Convergence de la loi de Student vers la loi de Gauss centrée réduite 


Sur cette figure, on constatera aussi la relation existant entre les fractiles 
LolV) et u,, de même ordre a respectivement pour la loi de Student 7} et pour 
la loi N(0 ; 1): 


La(V) < Ua < 0 si œ<0,5 
tAV)>us>0 si œ>0,5 


De même, on remarquera que la symétrie de la loi de Student lie les frac- 
tiles £,(v) et r,,(v) par la relation : #,,,(V) = - £{(v) 


Le coefficient d’asymétrie y, est bien entendu nul puisque la densité étant 
une fonction paire, tous les moments impairs sont nuls. Le calcul du coeffi- 
cient d’aplatissement y, est long, et nous admettrons le résultat : 


V2 = de valable si v > 4 
L’ensemble de ces deux résultats montre bien l’affinité de la loi de Stu- 
dent avec la loi de Laplace-Gauss, mais aussi la limite de cette similitude. En 
effet, on retrouve la symétrie de la loi et l’allure « en cloche » de la densité, 

mais c’est l’aplatissement aux extrémités qui fait la différence (et nous 
l’avons explicité pour la loi de Cauchy). Cependant, la valeur du coefficient 
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d’aplatissement de Fisher montre que cette différence s’atténue au fur et à 
mesure que le nombre de ddl augmente. 


Les calculs relatifs à la loi de Student utilisent la table des fractiles 
(Annexe IV). Cette table se lit en recherchant : 
1) dans la 1" colonne, la ligne correspondant aux ddl de la loi considérée ; 
ii) dans la 1" ligne, la colonne correspondant à l’ordre © du fractile ; 
et le fractile #,(v) se lit à l’intersection de la ligne et de la colonne déterminés. 


Ces fractiles sont donnés pour des valeurs de © supérieures à 0,5. Si © < 0,5 
on utilise la symétrie de la loi de Student et la formule #4{(V) = 1-4) 


D Exemples 
e le fractile d’ordre 0,9 d’une loi de Student à 5 ddl est égal à 1,476 
e le fractile d’ordre 0,3 d’une loi de Student à 10 ddl est égal à — 0,542 
e le fractile d’ordre 0,975 d’une loi de Student à 15 ddl est égal à 2,131 
e le fractile d’ordre 0,975 d’une loi de Student à 30 ddl est égal à 2,042 
e le fractile d’ordre 0,025 d’une loi de Student à 100 ddl est égal à — 1,984 


Dans les deux derniers cas, les fractiles correspondant de la loi de Gauss 
centrée réduite sont égaux à 1,96 et à — 1,96. On retrouve bien que l’approxi- 
mation de la loi de Student par la loi de Gauss est d’autant plus valable lors- 
que le nombre de dd est élevé (en particulier s’il dépasse 40). 


Comme pour la loi de Gauss et la loi du khi-deux, on dispose de formules 
approchées, pour la fonction de répartition ainsi que pour les fractiles, utili- 
sées notamment pour les calculs répétés sur ordinateur. 


Pour les fractiles, on utilisera l’approximation dite de Fisher et Cornish 


LV) us + at +134 y (Su + 1602 +3) 


96v? 
1 

+ TELL QU + 19ué + 17u8 —15) 

qui donne de bons résultats même pour de faibles ddl. Dès que  v > 30, on 

pourra utiliser la formule beaucoup plus simple : 


Uo 
to(V) Ua + Al de uG) 


Pour la fonction de répartition dans le cas général, c’est-à-dire pour v > 2, 
les formules sont fastidieuses à écrire. Elles n’ont d’intérêt que pour des pro- 
grammes de calculs et de simulation. Dans l’annexe II, nous indiquons les 
formules valables pour 1 ddi (l’erreur commise dans l’approximation par ces 
formules n’excède pas 0,001). 
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On notera que pour 2 dd, la fonction de densité s’intègre sans difficultés 
et qu’on a la formule exacte pour la fonction de répartition 


{ 
2 ,/2 + r?2 


La loi de Student est utilisée principalement pour l’estimation et les tests. 
Dans ce qui suit, on justifie brièvement ce rôle. 


P(0O<T;,<t) = valable pour toute valeur de 1 > 0 


Au paragraphe ILA, nous avons envisagé les quantités aléatoires x et 
Q dans le contexte de n va. X;(i= 1,2... ,n) de loi Nm ; 6). Ces deux va. 


suivent respectivement des lois Nm ; + jet 4x?(n). Nous pouvons écrire : 
n 


1€ n n : IS 
= =D) (X;-m).— = —-V2 où 2=-d (X;-m) 
Prize me — V 2e 
= 1= 
la variable aléatoire V? prenant la valeur correspondant aux observations {x;}, 
et pouvant être calculée quand on connaît la moyenne m". 
De nombreuses situations ne correspondent pas à ce cas. Il faut souvent 


utiliser la v.a. : 


3 

; : 1 n — 

Si on = D (x x,) 
= 


pour représenter la variance, à partir de séries obtenues par échantillonnage, 
et remplacer la v.a. Q par: 
2 
n 


D(x-x) (n—1)-52 


Q' = =! = n—] 


Le 6? 
Pour cette v.a. Q”, on peut écrire : 


= _ ; => 
Q r Lis _ > i n _ > Ÿ- où Y = i n 
6? (o] (o) 
Ces v.a. Ÿ: sont gaussiennes, mais ne sont pas indépendantes puisque l’une 
i 8 P P puisq 
d’entre elles s’exprime en fonction des autres : 


D (x-x,) = DX;-nX, = 0.On ne peut donc pas dire que leur somme, 
i=1l i=1 


c’est-à-dire Q”, est distribuée selon une loi 42(n).On montre qu’elle est en fait 


distribuée selon une loi %?(n — 1), et qu’elle est indépendante de 4 
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Considérons maintenant la variable aléatoire : 


Ed : 


[e] 


E Q’ Sh-1 


n—l 


D’après la définition donnée en tête de ce paragraphe, 7, suit une loi de 
Student à ( 7 — 1) ddl. C’est la v.a. qui est utilisée en lieu et place de 


X,-m re nes 
U = — - \n lorsqu'on cherche à étudier la moyenne d’une répartition 
6 


gaussienne dont la variance n’est pas connue au départ. 


Toutefois, nous avons vu que lorsque le nombre de ddl augmente, la loi 
de Student peut être approximée par la loi de Gauss (sur la figure 7.16, on 
voit que pour 25 ddi, les deux densités sont déjà voisines). On retiendra que 
le modèle de la loi de Student s’applique à l’étude de la moyenne d’une 
loi de Gauss dont la variance n’est pas connue, lorsqu’on ne dispose que 
d’un petit échantillon. 


C. L: loi de Fisher-Snedecor 


Définition 


S1 X et } sont deux v.a. indépendantes distribuées selon des lois de khi- 
deux respectivement à v, et V, ddl, la v.a. : 


re CA) x 


“ no. 
CA) * 
est dite suivre une loi de Fisher à v, et V, degrés de liberté. On la note 
F(V:, Vi) 
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On fera très attention dans la pratique de cette distribution à l’ordre des 
degrés de liberté. La loi de Fisher-Snedecor ! à v, et v, ddl n’est pas la même 
que la loi de Fisher-Snedecor à v, et v, ddl. 


En effet, on peut écrire : 


P(F(Vi, Vs) <c) = rfnX<c) - rfi t1) 
Vi Y Vo X C 


= 1 P(F((v Vi)< 1) 


Si cette probabilité est égale à ot, alors c n’est autre que le fractile f(v;, vi). 
Par conséquent, 1/c correspond au fractile f, ,(V;, V,). On obtient ainsi la rela- 
tion très utile, notamment dans la lecture des tables 
LL 
J œ (v 1° Vi) 

On peut montrer, par un calcul d’intégrales assez long, que la densité de 
la loi de Fisher-Snedecor F(v;, V2) est donnée par la formule : 


Jia (Vas Vi) = 


gr(X) r(v,/2)7(v,/2) (V2 + Vx)01+v2/2 
0 si x<0 


expression dans laquelle  T(v) représente la fonction eulérienne gamma 
($ IILA). 


Lorsque v, = 1, la densité, comportant un terme en 


+12 Il 


Ja(vs vo"! 


admet l’axe des ordonnées comme asymptote. 


x l2(V, + V,x) 02 


Lorsque v, = 2, la densité décroît régulièrement. 


En dehors de ces cas, comme on le voit sur la figure 7.17, la densité de la 
loi de Fisher-Snedecor présente un maximum après une croissance d’autant 
plus rapide que les degrés de liberté du numérateur sont peu élevés, puis une 
décroissance lente. C’est une densité très dissymétrique. 


1. L'étude de cette loi en tant que rapport de deux lois de khi-deux rapportées à leurs degrés 
de liberté est due au statisticien anglais Ronald Aymler Fisher (1890-1962), tandis que les 
développements numériques, et notamment l’établissement des tables ont été réalisés par le 
statisticien américain George Waddel Snedecor (1881-1974). 
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0 0,5 L 1,5 2 2,5 3 3,5 4 4,5 5 


Figure 7.17 -— Densités de lois de Fisher pour V; = 10 et quelques valeurs de V;, 


On remarquera que la loi de Fisher-Snedecor où v,= 1 se ramène à la loi 
de Student. En effet, le numérateur de la définition étant le carré d’une gaus- 
sienne centrée réduite, il s’ensuit qu’une telle loi F(1, v,) est le carré d’une 
v.a. distribuée selon une loi de Student à v, ddl. 


On peut déduire une relation entre les fractiles de la loi  Æ(1, v,) et ceux 
de la loi 7(v;), puisque : 


1-a = PF(VD<f a (LV) = P(TAvD < fa (LV) 
soit encore : 


1-0© 


Pfff V)<T()<+ fa v)) 
2P[T(V:) <+) fi _a (1 v.)) — ] 


Ceci revient à écrire : 


P(T(:) <+ fol, v)) = 1-0o/2 
et on obtient la relation entre fractiles : 


Nf1-a (1 Vi) = fi-a/2(V2) 


qui est une traduction numérique de la propriété 1 ci-dessous. 


Propriété 1 


S1 X est une v.a. distribuée selon une loi de Fisher à 1 et  v, ddl, alors 
X est le carré d’une v.a distribuée selon une loi de Student à v, ddi. 
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Le calcul des caractéristiques de la loi de Fisher-Snedecor montre que 


1) E(F(v, v)) = 5” l’espérance de cette loi ne dépend pas de v,, et 
= 
n’est définie que pour v, > 2 


AV CV, E V0) 


; , la variance de cette loi n’est 
Vi(V2—2)2(V; —-4) 


il) var( Fi, v:)) = 
définie que pour v, > 4 


On notera une relation, très utile au niveau des calculs, entre la loi de Fisher- 
Snedecor dont les degrés de liberté sont pairs et la loi binomiale (du type de 
celle qui est mentionnée au $ IIL.A entre la loi de Poisson et la loi du khi-deux). 


Propriété 2 


Si X est une v.a. distribuée selon une loi de Fisher-Snedecor 
FQ(n-r—1), 2r), et Y une v.a. distribuée selon une loi binomiale @(n ; p), 
on a la relation : 


P{x> EE.) = P(Y>r) 
p n-r-l 


Enfin, toujours pour la pratique au niveau des calculs, la formule suivante 
est une approximation correcte des fractiles de la loi de Fisher-Snedecor lors- 
que les degrés de liberté sont tous les deux suffisamment grands (au moins 


égaux à 50) : 
lie l> 42: 
Falve V2) 30031) ua SVT + V2) 


où ,, désigne le fractile d’ordre @ de la loi de Gauss centrée réduite. 


La loi de Fisher-Snedecor joue un rôle essentiel dans tous les problèmes 
posés par l’étude de la variance. Elle est le support des méthodes d’analyse 
de la variance et d’analyse discriminante. 


Les trois lois que nous avons présentées sous cet aspect de lois dérivées 
de la loi normale correspondent toujours à des variables aléatoires reliées à 
des variances d’échantillonnage dans des populations supposées gaussiennes. 
Ce ne sont donc pas des distributions qu’on peut identifier par une démarche 
concrète. Elles sont aussi souvent utilisées en tant que lois approchées, cor- 
respondant à des résultats asymptotiques. 


Elles sont toutes trois caractérisées par un ou deux paramètres appelés 
degrés de liberté . Cette notion se justifie mathématiquement (géométrique- 
ment) pour la loi du khi-deux, et se déduit pour les deux autres distributions 
de leur construction à partir de lois du khi-deux. 
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On caractérise la complexité d’une structure par le nombre de ses para- 
mètres indépendants qui la définissent (nombre de degrés de liberté). 


Nous avons vu qu’une v.a. du khi-deux à n degrés de liberté est la somme 
de n v.a., carrés de v.a. gaussiennes centrées réduites indépendantes, et nous 
avons évoqué que la non-indépendance des v.a. dont on additionne les carrés 
diminue les degrés de liberté de la loi du khi-deux correspondante. On peut 
ainsi regarder l’ensemble des v.a. gaussiennes de départ comme engendrant 
linéairement un ensemble (espace) dont la dimension est alors le nombre de ces 
v.a. linéairement indépendantes. Chaque relation linéaire qui relie certaines de 
ces variables aléatoires diminue d’une unité la dimension de l’ensemble consi- 
déré, c’est-à-dire l’ensemble sur lequel les éléments statistiques sont définis. 


IV. Quelques autres modèles continus courants 


A. L: loi log-normale 


Soit une variable aléatoire continue X prenant des valeurs supérieures à un 
nombre donné x,, la densité  f,(x) étant nulle si x <x,. Si la variable 
Z = In(X -— x,) est distribuée selon une loi de Gauss N (m ; 6), on dit que X 
est distribuée selon une loi log-normale notée ENK(m, 6, X6) > 


Z = In(X-x;,) S N(m:o) —=Z=oU+m avec U—N(0:1) 
EE  Ee 2 ONCE = 40) —m) 
Pour obtenir la densité de probabilité de X, on détermine d’abord sa fonc- 
tion de répartition : 
P(X< x) = P(X-x<Xx- x) 
PI[M(X-x,)-m<In(x-x,)-m|] 
In(x— x) —) 


[e] 


= P[U < 
car le logarithme est une fonction croissante. Par conséquent : 


A 
1 2 

P(X<x) = Fe dx pour À = 

N2T G 


M(x-xs)-m 


—co 
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et en dérivant par rapport à x, on obtient la densité d’une loi log-normale : 


A?2\ 1! 1 


5 exp( ©) | 6 | (x — xo) 


1 gpl [MG x0) 1 
GN2nA x) x. x (e] ) 


La loi log-normale dépend de 3 paramètres, m, 6 et x,. Les deux pre- 
miers sont les moments de la loi normale associée, tandis que le dernier 
est une caractéristique de position puisque c’est la valeur minimale de cet 
aléa. 


fx (x) 


On peut montrer que l’espérance mathématique et la variance de  X sont 
données par : 


E(X) = x, + exp(n + jo?) 


var(X) = e2"-es.(es-1) 
Déterminons maintenant la médiane Me : 


nm(Me-—x,)-m 
6 


F(Me)=0,5= À = =0 = Me = x,+e" 


Plus généralement, le fractile d’ordre © d’une loi log-normale 
EN (M, G, x), noté x,,, s’obtient de la façon suivante : 


P(X<x,) = P(In(X- x) < In(x-x0)) = P(oU +m< In(u x0)) 
_ P{u< rt | — 
© 
Su, _ LE _ Herr 


[e] 


Le mode Mo de la distribution log-normale, correspondant au maximum 
de la densité, est : 


Mo = x, + exp(m— 6?) 


Puisque 62>0,ona exp(-6?) < 1 et exp(o?/2)> 1, ce qui implique 
que le mode Mo, la médiane Me et l’espérance mathématique E{(X) vérifient : 
Mo < Me < E(X) 


La figure 7.18 donne l’allure de la densité pour quelques valeurs de m et 
de ©, avec x, = 0 
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0 0,5 1 1,5 2 2,5 3 3,5 4 


Figure 7.18 — Influence des paramètres m (0 /0,5/1) etc (0,1/0,2) 
sur la densité de la loi log-normale 


L'expression du coefficient d’asymétrie 7, = (e%+2),/e° - 1 montre 
que l’asymétrie dépend de © (cf. figure 7.19). 


En particulier, lorsque © devient très petit, on obtient des distributions 
log-normales ressemblant fortement à des distributions normales, tout en ne 
prenant que des valeurs strictement positives. 


1,6- 


1,4: 


0 0,5 1 1,5 2 2,5 3 3,5 4 


Figure 7.19 — Asymétrie de la loi log-normale ÆN(0, 1, 6) en fonction de © 
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Cette dernière propriété fait de la loi log-normale un modèle très intéressant 
pour de nombreux phénomènes à valeurs positives, et pour lesquels la loi de 
Gauss donnerait des probabilités non nulles à des domaines de valeurs négati- 
ves. Par conséquent, lorsqu'une distribution gaussienne (respectant donc les 
caractéristiques de symétrie et d’aplatissement) apparaît adaptée à la représen- 
tation d’un phénomène aléatoire qui, toutefois, ne prend que des valeurs posi- 
tives, on recherchera une loi log-normale dont les paramètres seront adaptés. 


Dans ce contexte, on trouve notamment des répartitions de poids, de taille 


La durée des communications téléphoniques est très souvent un bon 
exemple de modélisation par la loi log-normale. Dans tous les cas, lorsque 
l’hypothèse de répartition log-normale est adoptée, il suffit de prendre le 
logarithme de toutes les observations pour se ramener à un contexte de loi 
normale, et d’appliquer alors toutes les propriétés vues au $ IL. 


Les distributions de revenus sont souvent modélisées par la loi log-nor- 
male en raison de leur asymétrie, de leurs valeurs toujours bornées à gauche, 
et de l’effet atténuateur de la transformation logarithmique. 


D Exemple 
Illustrons ce propos en ajustant les distributions des salaires « Ensemble » 
en 2000 (chapitre 1, tableau 1.5) par une loi log-normale. 
Si X suit une loi log-normale EN (M, ,Xo), 
alors U = (In((X-x,)-m))/6 suit une loi normale centrée réduite. 
Dans ce cas, les points de coordonnées { u;, In(x; - x,)} sont alignés, u; 
étant le fractile d'ordre i/10 delaloi N (0 ; 1) si x; estle à décile 
observé, et x, le salaire minimum (égal à 6 200 € en 2000). 


Le résultat de l’ajustement est présenté graphiquement ( cf. figure 7.20). 
Les 9 points étant proches de l’alignement sur le graphique, 
l’ajustement par une loi log-normale peut être retenu. 


C2 y # =LOI.NORMALE.INVERSE(E2:0;1) 
DEN E M] F | G | H | | 
Déciles Fi u; Xi Infx i-x 0) Infr à - x0) 
Di 0,1 [ -1,28 l 10790 | 8,43 
Di 0,2 | -084 | 12220 | 8,70 
D3 0,3 | 0,52 13520 | 8,90 
Ds 0,4 | -025 14910 | 9,07 
Médiane | 0,5 0,00 16500 | 9,24 
Dé 0,6 0,25 18410 | 9,41 
D: 0,7 0,52 20890 | 9,59 
De 0,8 0,84 | 24780 | 9,83 
Do 0,9 128 | 32810 | 10,19 "2 1 0 1 2 


Figure 7.20 — Distribution des salaires « Ensemble » en 2000 ajustée par une loi log-normale 
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B. L: loi de Pareto 


Définition 


On dit que la v.a. continue X est distribuée selon une loi de Pareto de 
paramètres © et x, > 0 si sa densité est donnée par : 


œ+l 
œ (x À 
œ(#) SN 
fx(x) = 1 xo\ x 
0 Si X <X9 


On notera d’abord que cette fonction fy(x) ne définit une densité que si & > 0 


Figure 7.21 - Densités de lois de Pareto, pour x , = 1, et plusieurs valeurs de © 


La fonction de répartition de X (cf. figure 7.22) est donnée par un calcul 
élémentaire. Elle est, bien entendu, nulle pour x <x,,etsi x 2x, ona: 


x œ+l x œ 
= {afro = fS\sosr f dt fx 
FxQ) = (21) " CE} ls o) 


0 0 
On écrira donc : 
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La probabilité d’une valeur supérieure à un seuil fixé x, tel que 


œ 
{x > x, > 0}, est égale à (&) 
x 


1,0 


0,8 
0,6 
0,4 


0,2 


0 
0 1 2 3 4 


Figure 7.22 — Fonctions de répartition de lois de Pareto pour x, = 1 et plusieurs valeurs de 


Pareto! a introduit sa loi pour décrire des unités économiques par des carac- 
tères de taille (revenu, chiffre d’affaires, budget d’investissement..…). Pour de 
telles grandeurs, on postule le plus souvent que le nombre d’individus dont le 


caractère étudié dépasse un seuil x est donné par N, = = où Cet & sont des 
x 


constantes. L'application de la loi de Pareto aux distributions de revenus est 
une des plus usuelles, le paramètre © étant en général voisin de 2 


Le calcul des moments est simple. On a d’abord 


2 NAT 2 œx 
E(X)= (212) di = x) de = 2 
Xo/\ X L 

Xo Xo 
mais ce résultat n’est valable (convergence de l’intégrale) que si &« > 1 Remar- 
quons qu’une v.a. distribuée selon la loi de Pareto ne prend que des valeurs 
positives (x, > 0), ce qui implique que son espérance mathématique est posi- 
tive. Un résultat correspondant à @ < 1, soit (ot — 1) < 0, serait absurde. 


Plus généralement, on a : 


| co œ x œ+l d ox 
re [EE] dut ie 
À 0 to — 


1. La loi étudiée dans ce paragraphe porte le nom de l’économiste italo-suisse Wilfrid Pareto 
(1848-1923). C’est à lui qu’on doit l'hypothèse, qu’il a supposée «universelle », de la décrois- 
sance en x - ® de la proportion des individus dont le revenu dépasse la valeur x. 
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mais ce calcul n’a de sens que si l’intégrale est convergente, c’est-à-dire si 
(œ—-k+1)> 1, soit si &« >k. Le moment d’ordre & n’est donc défini que lorsque 
œ > k. En particulier, la variance n’est définie que si > 2. Son calcul est simple : 


2 2,2 2 

XX) . XX) = OX 

œ—2 (@œ—1)}2 (&œ—-2)}(a-— 1)? 
Les lois conditionnelles dérivées d’une loi de Pareto ont la propriété 

essentielle d’être encore des lois de Pareto. Si  X suit une loi de Pareto de 

paramètres © et x, et Si xj 2 Xp 

P(x,; <X< x) _ (Xo/xX1)%— (xo/x)® 

1-P(X<x;) (Xo/x,)% 


var(X) = E(X?)-(E(X)) = 


P(X<x|X2x;) = = 1-(x,/x)4 


ce qui montre bien que la v.a. (X|X 2 x,) suit une loi de Pareto de 
paramètres © et x; 


On a ainsi ramené l’« origine » de la distribution en x, , sans rien changer 
à sa forme. On notera aussi qu’on a : 


OX; 
œ— 1 


E(X]X2x;) = 


œ 
L'écriture de la fonction de répartition pour x 2 x, F(x) = 1- (2) permet 
de voir que : ds 


m(1-F(x)) = œIn(x,) -œIn(x) 


Les points de coordonnées {In(x) ; In(1 - F(x))} sont donc situés sur une 
droite de pente — ot, coupant l’axe vertical en un point d’ordonnée © In(x;) 


Réciproquement, si les points de coordonnées {In(x) ; m(1-F(x))} 
pour une distribution de fonction cumulative  F sont situés sur une même 
droite de pente — ©, cette distribution correspond à une loi de Pareto puisque 


si n(1-F(x)) = -œin(x) +K,0ona : 
1-—-F(x) = x%-eK = (A/x)% avec A = eK 

Cette représentation graphique fournit une méthode très simple (et effi- 
cace) pour apprécier si une distribution observée, soit (x,, i= 1,2,... ,n) peut 
être représentée par un modèle de Pareto, en traçant le nuage des points de 
coordonnées ,{ In(x;) ; In(1-F(x;))} où F{(x;) est la valeur de la fonction 
cumulative en x; (chapitre 1). L'utilisation d’échelles logarithmiques sur les 
deux axes est très appréciable. Elle est très courante sur les logiciels. 


On peut ainsi valider l'hypothèse de représentation par une loi de Pareto, 
mais aussi identifier les paramètres puisque la constante & est la valeur abso- 
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lue de la pente de la droite (elle peut être calculée par la méthode des moin- 
dres carrés, chapitre 3). 


Il faut remarquer que dans cette représentation graphique, on trouve en 
ordonnée les valeurs (sur une échelle logarithmique) de {1-F(x)}, c’est-à- 
dire de la proportion résiduelle au-delà de la valeur x. Ceci nous reporte à 
l'introduction de cette loi par Pareto, et à l’utilisation très fréquente des 
échelles logarithmiques dans l’étude des variables de type taille. 


D Exemple 


L’exemple suivant illustre une modélisation par une loi de Pareto du 
chiffre d’affaire des 25 premiers groupes français de l’industrie et des 
services en 2001. Les données sont extraites des Tableaux de 
l'Économie Française 2003-2004. 


FRERE -1/1 7 


TotalFinaElf 11,565 
Carrefour 11,149 
Vivendi Universal 10,957 
PS4 Peugeot Citroën 10,852 
France Telecom 10,670 
Suez 10,654 
EDF 10,614 
Les Mousquetaires 10,524 
Renault 10,501 
Saint-Gobain 10,322 
Pinault-Printemps-La Redoute 10,233 
Groupe Auchan 10,174 
Alcatel Alsthom 10,141 
Galec (Leclerc) 10,127 
Alstom 10,063 
Aventis 10,041 
Groupe Casino (Rallye) 9,998 
Bouygues 9,927 
Airbus (ŒADS) 9,925 
SNCF 9,910 
Vonci 9,751 
La poste 9,743 
Publicis Groupe 9,721 
Michelin 9,666 
Havas 9,612 


Tableau 2.1 -Tableau 7.1 
Les points {In(x;) ; In(1 -F;)} sont à peu près alignés (cf. figure 7.23). 


Le calcul de la droite des m  oiïndres carrés donne pour estimation des 
paramètres du modèle de Pareto & = 1,646 et x, = 16 774. 
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9,5 10,0 10,5 11,0 11,5 12,0 


s à y = - 1,646x + 16,014 In(x;) 
-0,5 N, r2 = 0,9793 


-3,5 In(1-F) 


Figure 7.23 — Série des valeurs des 25 premiers chiffres d’affaires français 
ajustée par une loi de Pareto 


Un diagramme quantile-quantile obtenu à partir de la loi de Pareto asso- 
ciée à ces paramètres montre lui aussi que le modèle n’est pas inadapté, mais 
que l’ajustement n’est pas parfait en raison la première valeur particulière- 
ment élevée. 


120 


100 


co 
© 


an 
© 


40 


Quantile observée 


20 


O0 20 40 60 80 100 120 
Quantile théorique 


Figure 7.24 — Diagramme Quantile-Quantile (unité : milliards d'euros) 
Loi de Pareto de paramètres © = 1,646 et xo = 16 774 
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Pour terminer, on notera que la moyenne d’une loi de Pareto de paramètres © 
et x, est égale à © - x/(ot — 1), et que sa médiane est égale à x, - 21/4 

Pour l’exemple, on peut comparer la moyenne observée égale à 33 169 
millions d’euros à la moyenne du modèle théorique égale à 42 740 millions 
d’euros, et la médiane observée égale à 25 353 millions d’euros à la médiane 
du modèle théorique égale à 25 558 millions d’euros. 


Les paramètres du modèle de Pareto ont été évalués à l’aide de toutes les 
observations avec une première valeur particulièrement élevée. Ceci explique 
la surévaluation non négligeable de la moyenne par le modèle. 


D'autre part, on notera que les médianes (théorique et observée), plus 
petites que les moyennes correspondantes, indiquent une distribution dissy- 
métrique, étalée vers la droite (chapitre 1). 


C. La loi de Weibull 


Définition 


Une v.a. continue X suit une loi de Weibull de paramètres a, b > 0 et 
c > 0, si sa densité est donnée par : 


(is e) eo si x>a 
f() = 4 b 
0 Si xET 


Si X suit une loi de Weïbull de paramètres a, b et c, alors Y = = 
une loi de Weibull de paramètres 0, 1 et c. En effet : 


P(Y<)y) _ P(rt< ) - PR 0 _ Éd À 
b ner 


et la densité de Y est égale à la dérivée de cette dernière expression. Pour 
a+by>a, soit si y>0: 


tie x (ere) 


FO) = 0 si (y<0) 
On appelle loi de Weibull standard de paramètre c, notée W(c), la loi de 


FO) = bff 


= cyC-De+ et 


y = À-a 


lorsque X suit une loi de Weïibull de paramètres a, b et c. On 
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remarque que pour c = 1, la loi de Weïbull standard correspond à la loi expo- 
nentielle. La figure 7.25 représente les densités de la loi de Weïbull standard 
pour les valeurs c = 1, 2, 3 et 5. On voit que cette densité est asymétrique, et 
présente un maximum si c > 1 pour : 


Figure 7.25 — Densités de la loi de Weibull standard 


Lorsque c > 1, le mode de la distribution de Weïbull standard se rapproche de 
1 lorsque c tend vers l’infini. Dans le cas général de la loi de Weïbull de para- 
mètres a, b et c, le mode converge rapidement vers ( a + b) lorsque c augmente. 


Par contre si 0 < c< 1, le mode est en 0, car la densité est décroissante. 


La fonction de répartition de la loi de Weibull standard est donnée par 
F(x) = Jer- le-tdt 
0 
soit en posant u = 1° : F(x) = fe-"au = [-e#]ÿ = 1-e* six>0 
0 
et naturellement F{x) = 0 si x < 0 


Dans le cas général, posant X = a + bY, où Y suit une loi de Weïibull stan- 
dard, on a : 


P(X<x) = P(a+bY<x) = p{r<it) = 1e F) six>a 


et P(X<x)=0 six<a 


Ceci nous montre que la médiane est le point w,, tel que : 
Wos = b:(In2)!//<+a 
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Le calcul de la moyenne de la loi de Weïibull standard donne 


C 


E(Y) = fexce"dx = frce-ar = r{: + 1) 
0 0 


obtenu en posant f = x° dans la première intégrale, et en exprimant la seconde 
intégrale à l’aide de la fonction gamma ($ IIL.A). 


De même, on peut calculer E(#2) : 


co 


E(Y?) = fexc+te-“ax = fred = r{: +2) 
0 


0 
ce qui permet donc d’écrire la variance : 
: se) 1Ÿ 
var(Y) = I|1+-|-T|1+- 
c c 


L'expression des moments dans le cas général de la loi de Weibull de 
paramètres a, b et c provient de la relation X = a + bY: 


E(X) = a+b-T{1+1) 


var(X) = mr(i + 2)- (r(: . 1) 


La dissymétrie de la loi standard de Weïibull, observée sur la figure 7.26, 
varie avec la valeur du paramètre  c. La moyenne tend vers 1 au fur et à 
mesure que c augmente, tandis que la variance décroît. Les coefficients 
d’asymétrie et d’aplatissement de Fisher montrent que pour c à peu près égal 
à 3,6 on obtient une courbe presque symétrique ( y, = 0), mais dont l’aplatis- 
sement est légèrement moindre que celui de la loi de Gauss ( y < O0). 


1,6 


—-- W(3) 
— W(3,6) 
—— N(0,9: 0,278) 


1,2 


0 L 2 3 4 
Figure 7.26 — Lois de Weibull standard et loi de Gauss 
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Il s’ensuit ( cf. figure 7.26) que pour des valeurs de c proches de 3,6, la 
distribution standard de Weïibull et la loi de Gauss ont des formes assez pro- 
ches. On notera que pour cette valeur c = 3,6, la moyenne de la loi standard 
de Weibull est égale à 0,9011 et son écart-type à 0,278 

Il est intéressant de noter que pour une loi de Weïbull standard de para- 
mètre c, l’expression de la fonction de répartition permet d’écrire 


h(l-Fy(y)) = - y° 
soit encore : n{-In(1-Fy(y))} = cIn(y) 


ce qui montre qu’on peut, comme pour la loi de Pareto, mais avec une échelle 
« log-log » sur l’axe vertical, évaluer graphiquement si une distribution 
observée peut être représentée par une loi de Weïbull standard. 


L'intérêt particulier de la loi de Weibull réside dans la propriété suivante. 


Propriété 
Si Ÿ suit une loi de Weibull standard W{(c), alors YC suit une loi expo- 
nentielle de paramètre 1 


En effet, soit Z= Y‘°. Si z<0, on aura P(Z<z)=0etsiz >0,on peut écrire : 
Ve 
P(Z<z) = P(Yc<2) = P(Y <z1e) = Ï cte-letdt 
0 
et la densité, nulle pour z < 0, s’obtenant par dérivation pour z > 0, est bien 
égale à ex 
La loi de Weibull ! doit ainsi s’envisager comme une généralisation du 
modèle exponentiel, tout particulièrement dans les contextes où l’étude porte 
sur le temps écoulé jusqu’à la réalisation d’un certain événement. 


D. L: loi logistique 


Définition 
Une v.a. X continue suit une loi logistique si sa fonction densité est don- 


née par : 
exp (= — c) 
nn be 


; avec B >0 


FC) = 


1. Nommée ainsi en raison des travaux du statisticien suédois Waloddi Weïbull qui en a montré 
l'intérêt (entre 1939 et 1954) pour une très large gamme d’applications, industrielles notamment. 
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Un calcul très simple montre alors que la fonction de répartition est don- 


née par : 
F(x) = (1 + exp( es) 


X-0 


Sionpose Ÿ = , on obtient la forme réduite de la distribution 


logistique, définie par la densité et pour laquelle la fonction de 


(1+e-)2° 


répartition est ] L - . La densité de Y est symétrique puisque : 
+e 


… _(æ) . (%) our à 


(l+ey at + ls ) (c+ 1)/ev ÿ. MERE 


Ceci conduit à constater que la variable  Y est centrée, E(Y) = 0, et que 
E(X) = ©. Le paramètre © de la définition de la distribution logistique est 
donc égal à sa moyenne. Le calcul de la variance donne le résultat 1: 


2 
var(Y) = se , ce qui donne : var(X) = LE 
La courbe représentative de la densité est encore une courbe en cloche, 
en raison d’une part, de la symétrie et d’autre part, de l’existence d’une 
asymptote horizontale, d’un maximum et de deux points d’inflexion. La 
comparaison de cette densité avec celle de la loi normale est justifiée si l’on 
choisit des paramètres qui assurent l’égalité des moyennes et l’égalité des 
variances. Compte tenu de ce qui précède, il faut choisir la loi logistique 
de paramètres : 


aœ=0 et f= DL 65513 
T 
On observe alors ( cf. figure 7.27) que les deux densités sont assez pro- 
ches. En raison de la symétrie, le coefficient d’asymétrie y , est nul, et la 
comparaison entre le coefficient d’aplatissement ;, égal à 0 pour la loi de 
Gauss centrée réduite et à 1,2 pour la loi logistique, traduit bien la limite de 
leur ressemblance. 


et l’utilisation des fonctions eulé- 


1. Le calcul passe par le développement en série de 


; —y 
TriEnnes. l+e 


LES PRINCIPAUX MODÈLES STATISTIQUES CONTINUS e 269 


——- Logistique (0; 1) 
---" Normale (0; 1) 
Logistique (0; 0,5513) 


= £$ <2 0 1 2 3 4 


Figure 7.27 — Densités comparées de lois logistiques et de la loi normale centrée réduite 


Deux relations concernant la loi logistique standard ( ot = 0 et B = 1) sont 
particulièrement utiles : 


OS FOI CES FO 


y = In FO) 
1=F01 

Elles font ressortir l’intérêt de la loi logistique dans les situations binaires. 
Cette loi est particulièrement utile pour modéliser des systèmes où la réponse 
(aléatoire) à une intervention est du type « tout ou rien » (ou encore positive 
ou négative). Pour ces situations, on suppose souvent que la proportion de 
réponses positives suit une loi logistique et on parle alors d’analyse de type 
« logit ». On choisit de préférence la loi logistique dans ces problèmes, mais 
certains modélisent par la loi de Gauss et on parle alors d’analyse de type 
« probit ». Mais l’interprétation « mécaniste » n’est alors pas aussi fine que 
celle découlant de la loi logistique. 


La fonction définissant la fonction de répartition de la loi logistique stan- 
dard est utilisée intensivement pour représenter les phénomènes de crois- 
sance (entre deux limites) avec le temps. Dans ce contexte, elle est obtenue 
en partant d’une équation différentielle traduisant la proportionnalité en tout 
point entre d’une part le taux de croissance, et d’autre part le produit des 
différences avec les valeurs extrêmes, soit : 

D = c(F(-DL-F(x)) 
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V. Bilan 


Les modèles présentés dans ce chapitre et dans le précédent sont ceux qui 
sont le plus souvent utilisés dans l’étude de situations aléatoires concrètes. On 
n’oubliera pas cependant que d’autres modèles présentent un intérêt certain 
pour la modélisation. Ils ne peuvent être présentés ici, mais on se doit de citer : 

— la loi binomiale négative ; 

— la loi log-normale, la loi de Wald, les lois gamma et bêta ;: 

— les lois de khi-deux, de Student et de Fisher-Snedecor décentrées. 


D'autre part, nous n’avons envisagé que les lois de variables aléatoires à 
valeurs réelles. Les distributions de v.a. à valeurs dans R° n’ont pas été abor- 
dées. Leur utilisation est cependant fréquente. 


L’ensemble de ce chapitre montre l’intérêt particulier de la loi de Gauss. 
Approximation de lois discrètes ou de lois continues, mais aussi loi approchée 
des moyennes d’échantillonnage, la distribution gaussienne est au centre de 
l’édifice statistique dès qu’on cherche à modéliser des situations aléatoires. 


Ses propriétés (symétrie, stabilité après transformation linéaire) et son uti- 
lisation particulièrement simple pour les calculs expliquent le recours très 
fréquent à cette loi. Cependant, on ne doit pas se laisser abuser, et nous avons 
vu que plusieurs problèmes spécifiques conduisent à d’autres lois, soit par 
construction (cas des lois du khi-deux, de Student, de Fisher-Snedecor), soit 
par ajustement (lois de Pareto, exponentielle, logistique, de Weibull). 


Le sens de l’hypothèse de normalité émerge de cette position centrale de la 
loi de Gauss, comme aussi de son apparence. La loi de Gauss est celle qui 
s’impose lorsque le phénomène qu’on étudie ne présente pas de déterminant 
prédominant. En ce sens, la distribution normale correspond à une répartition 
sans caractéristique ou individualisation particulière. Elle serait donc presque le 
modèle à utiliser si aucun autre ne s’imposait. D'ailleurs, c’est historiquement 
ainsi qu’elle a émergé pour représenter de façon « universelle » les phénomènes 
au sens de la moyenne! (c’est-à-dire observés comme moyennes arithmétiques). 


On se gardera bien de vouloir à tout prix poser une hypothèse de normalité 
dans une attitude descriptive. Réservant la loi de Gauss pour des phénomènes 
agrégeant réellement de multiples causes indépendantes les unes des autres 
sans cause prédominante, on recherchera toujours le modèle (moins passe- 
partout, mais donc plus « savoureux » et surtout plus riche) décrivant vrai- 
ment au mieux les observations. La controverse entre univers gaussien et uni- 
vers parétien en est une illustration. 


1. D'abord par Laplace à la fin du 18 siècle, puis par Gauss en 1809, et enfin par Galton en 1889. 
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On n’oubliera pas : 


1. Pour la loi de Gauss 
+ La symétrie par rapport à la moyenne. 
* La pratique des calculs par centrage et réduction 


X=sNioau es TAN 


+ Son intérêt comme modèle approché (limite centrale, lois binomiale 
et de Poisson). 


+ Une somme de gaussiennes indépendantes est une gaussienne. 


2. Pour les lois dérivées de la loi de Gauss 


Xi 5 Xi À . gaussiennes centrées réduites 


Yi,Y3,.., Ÿ, gaussiennes centrées réduites 
toutes indépendantes 


Ÿ Ÿ 


M V, 
Z,= SX y4v,) Z= D Yi x(v) 
i=l j=l 
khi-deux à v, degrés de liberté khi-deux à v, degrés de liberté 
loi dissymétrique loi dissymétrique 
de moyenne v, et de variance 2v, de moyenne v, et de variance 2v, 
U — N(0 ; 1) 


U et Z; indépendantes 


Zi/v, 2 Zi 
Zi Vi 2 


U à F(V;,, Vi) — 
LG. est une v.a. symétrique, 
1 


— centrée : : stri : 
v. est une v.a. dissymétrique : 


Vi 


loi de Fisher- 
loi de Student à V, degrés de liberté DR AS FRA SRERRSE 


à v, et v, degrés de liberté 


(M =l)= FM) = | 


3. La loi de Pareto de paramètres x9 et & peut décrire des grandeurs au 


moins égales à x, et pour lesquelles le nombre d’observations qui dépas- 
sent un seuil x est proportionnel à x %. Son moment d’ordre k n’existe que 
pour k < ot. C’est une loi dissymétrique. 


4. La loi de Weibull standard de paramètre c est une loi dissymétrique 


souvent utilisée pour décrire le temps écoulé jusqu’à la réalisation d’un 
événement donné (décès, faillite, panne, reprise d’activité..….). Elle géné- 
ralise la loi exponentielle. 
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Testez-vous (es réponses sont données page 287) 


1. Une variable aléatoire de Bernoulli : 

a) a une loi de probabilité ne dépendant que d’un seul paramètre 
b) a une espérance égale à son écart-type 

c) a une variance maximum lorsque son paramètre est égal à 0,5 


d) est une variable indicatrice 


2. Si X suit une loi binomiale (a ; P) : 

a) X est la somme de n v.a. de Bernoulli de même espérance mathématique 
b) X est la somme de n v.a. de Bernoulli indépendantes 

c) l’écart-type de X est égal à np(1 — p) 

d) Y = X + 1 suit une loi binomiale (n ; p) 


3. Soit X une variable aléatoire binomiale B(n ; p)etY=n-X: 

a) pour toute valeur entière k comprise entre 0 et n, P(X=k)=P(Y=n-k) 
b) Y suit une loi binomiale %(n ; 1 — p) 

c) X et Ÿ ont même espérance mathématique 


d) X et Ÿ ont même variance 


4. Si X suit une loi de Poisson de paramètre 10 : 
a) var(X) = 10 

b) P(X= 10) = P(X=9) 

c) Y =2X + 1 suit une loi de Poisson de paramètre 21 


d) la fonction de répartition de X est une fonction continue 


5. Si X suit une loi géométrique de paramètre p : 

a) on peut aussi dire que X suit une loi de Pascal 

b) X est une somme de v.a. de Bernoulli indépendantes de paramètre p 
c) l’espérance de X dépend du nombre de tirages 


d) E(X) > var(X) 


6. Si X est distribuée selon une loi %(n ; p) : 

a) si n = 10 et p = 0,1, alors P(X = 4) = P(X=S5) 

b) si n = 60 et p = 0,05, alors P(X > 3) = 0,5768 

c) si n =4 et p = 0,01, alors P(X = 0) = 0,96 

d) si n = 50 et p = 0,08, alors P(3 < X < 10) = 0,573 


7. Pour une population distribuée selon une loi de Gauss NA ; 1): 
a) la médiane est égale à 1 

b) la moyenne est égale à 0 

c) le quart des individus est caractérisé par une valeur supérieure à 1 


d) la moitié des individus est caractérisée par une valeur inférieure à O 
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8. Pour une population distribuée selon une loi N'(0 ; 1), le pourcentage d’indivi- 
dus qui sont caractérisés par une valeur comprise entre — 1,96 et + 1,96 est égal à : 


a) 75% 
b) 90% 
c) 95% 
d) 99% 


9. Si X suit une loi de Gauss N(2 ; 5) : 
a PK =2)= 7,40) = 168427 

b) P(X < 1) = P(X > + 3) = 0,4207 

c) P(—3 < X <+3) = 0,4206 

d) PA <X<3)=0,1586 


10. Si X suit une loi de Gauss N'(n ; o) : 

a) P(X > m)=0,5 

b) sa moyenne est égale à sa médiane 

c)F{m+x) =F{(m-x) 

d) le graphe de la densité est symétrique par rapport à la droite d’équation x=0 
11. Si X est une variable aléatoire N'(1 ; 1) et Y une variable aléatoire 
(1000 ; 0,01) et si X et Y sont indépendantes : 

a) EX +Y)=11 

b) var(X + Y) = 10,9 

c) YŸ suit approximativement une loi de Poisson de paramètre 10 


d) le coefficient de corrélation linéaire entre X et Y est égal à + 1 


12. Si une population est représentée par une variable aléatoire X de loi N'(m ; o) : 
a) 25% des individus s’écartent de la moyenne de plus d’un écart-type 

b) 50 % des individus sont au-dessus de la moyenne 

c) à peu près 5 % des individus s’écartent de la moyenne de plus de 2 fois l’écart-type 
d\F{m+x)=1-F{(m-x) 

13. Si X est une variable aléatoire N(1 ; 1) et Y une variable aléatoire 

(100 ; 0,5) et si X et Y sont indépendantes : 

a) E(X + Y)=51 

b) X suit approximativement une loi de Poisson de paramètre 50 

c) X + Y suit approximativement une loi de Gauss 

d) Z=2X +3 suit une loi de Gauss 


14. Soit X une variable aléatoire N(- 3 ; 1) : 
a) X est une variable aléatoire réduite 

b) X + 3 est une variable aléatoire centrée réduite 
c) P(X +3 > 0) = P(X +3 <0) 

d) EX2) = 1 
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15. Si X suit une loi exponentielle de paramètres 0= 0 et ÀA=2 

a) la fonction de répartition de X est une fonction continue 

b) l’espérance de X est égale à sa variance 

c) la fonction de densité de X est une fonction qui admet un axe de symétrie 


d) X ne prend que des valeurs supérieures à 2 


16. Soit Ÿ une somme de # variables aléatoires indépendantes X,, .… X), … X, : 
a) si les X; sont des v.a. binomiales, alors Y suit une loi binomiale 

b) si les X; suivent des lois de Gauss, alors Y suit une loi de Gauss 

c) si les X; suivent des lois exponentielles, alors Y suit une loi exponentielle 

d) si les X; suivent des lois de Pareto, alors Y suit une loi de Pareto 

17. Si la demande hebdomadaire d’un produit dans un magasin suit une loi bino- 


miale %(30 ; 0,45), alors si on suppose les demandes hebdomadaires indépendan- 
tes entre elles, la demande annuelle de ce même produit (1 an = 52 semaines) : 


a) suit une loi binomiale (1560 ; 0,45) 

b) suit approximativement une loi de Gauss N (702 ; 19,65) 

c) est une somme de v.a. de Bernoulli indépendantes 

d) ne peut pas être égale à 1 600 

18. Si la demande quotidienne d’un produit dans un magasin suit une loi bino- 
miale % (40 ; 0,05), alors si on suppose les demandes quotidiennes indépendantes 


entre elles, la demande de ce même produit pour 25 jours de fonctionnement de 
ce magasin suit : 


a) à peu près une loi de Poisson #(50) 
b) à peu près une loi normale N(50 ; 6,9) 
c) une loi binomiale (40 ; 0,2) 

d) une loi de Poisson ®(0,2) 
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Exercices (corrigés page 324) 


Exercice 7.1 


Le prix X d’un certain article est supposé distribué selon une loi de Gauss de para- 
mètres mn = 45 € etc =4 € 


1. Calculez P(X < 39), P(X > 48) et P(35 < X <48) 
2. Calculez P(|X-m|)<o 
3. Calculez P(41<X2Z49]X 239) 


Exercice 7.2 


Les gains mensuels en euros d’un représentant sont supposés suivre une loi normale. 
Il a pu constater, sur un grand nombre de mois, la répartition suivante de ses gains 


Gain > 3 000 : 4,46 % 
2 400 < Gain < 3 000 : 93,26% 
Gain < 2 400 : 2,28% 
1. Calculez la moyenne et l’écart-type de la loi normale envisagée. 


2. Si on suppose les gains du représentant indépendants d’un mois à l’autre, quelle 
est la loi de probabilité de la variable aléatoire égale au gain du représentant pen- 
dant 3 mois ? 


3. Quelle est la probabilité que le représentant gagne plus de 8 700 € en 3 mois ? 


Exercice 7.3 


Une usine fabrique des imprimantes laser dont la durée de vie  X (exprimée en mil- 
lions de pages) est une variable aléatoire normale N'( : 0,3). 


1. Calculez la probabilité p que la durée de vie d’une imprimante tirée au hasard dans 
la production soit supérieure à 2,5 millions de pages. Dans la suite de l’exercice, 
on arrondira cette probabilité p pour ne conserver que 2 chiffres après la virgule. 


2. On teste 60 imprimantes tirées au hasard dans la production. Déterminez, en la 
justifiant, la loi de la variable Y égale au nombre d’imprimantes dont la durée de 
vie est supérieure à 2,5 millions de pages. Donnez, en la justifiant, une loi appro- 
chée de 7. 


3. Calculez la probabilité que parmi les 60 imprimantes testées : 


— exactement 10 % des imprimantes aient une durée de vie supérieure à 
2,5 millions de pages, 


— au moins 5 % des imprimantes aient une durée de vie supérieure à 2,5 millions de 
pages. 
Exercice 7.4 


Un groupe de presse décide de lancer un nouveau quotidien. Une enquête permet de 
conclure que, pendant les 30 jours consécutifs à la date du lancement, la demande 
journalière (exprimée en milliers d'exemplaires) est une v.a. X dont la loi de proba- 
bilité peut être considérée comme une loi normale de paramètres m = 100 et 6 = 25. 


1. Calculez la probabilité d’avoir pendant la période considérée : 
— une demande journalière comprise entre 75 et 125 ; 


— une demande journalière de plus de 150. 


276 e INTRODUCTION À LA MÉTHODE STATISTIQUE 


© Dunod. La photocopie non autorisée est un délit. 


2. Calculez les valeurs n, et n, telles que : 
— la demande journalière soit supérieure à n,, 9 jours sur 10 ; 
— la demande journalière soit inférieure à n>, 4 jours sur 10. 


3. Déterminez un intervalle symétrique autour de m ayant 90 % de chances de 
contenir la demande journalière. 


Exercice 7.5 


Un vigneron commercialise des vins de qualité différentes qu’il répartit en deux 
classes : la classe des vins courants dits « du terroir », la classe des vins de qualité, 
appelés « grand cru », et vendus 6 € la bouteille. Malgré le soin apporté à l’embou- 
teillage, il subsiste des erreurs d’étiquetage, et on admet qu’un acheteur de vin 

« grand cru » aura une probabilité p = 0,12 d’avoir en fait une bouteille de vin ordi- 
naire. 


1. Un restaurateur achète 200 bouteilles « grand cru » au vigneron. Soit Y la v.a. 
égale au nombre de bouteilles de vin courant parmi les 200 bouteilles achetées. 


Déterminez la loi de probabilité de la v.a. Y, ainsi que son espérance et sa variance. 
Donnez, en la justifiant, une approximation de la loi de Y. 


2. Calculez : P(Y > 20) et P(Y < 30/Y > 20). 


3. Au fur et à mesure de la consommation des 200bouteilles, le restaurateur a pu détec- 
ter chacune des bouteilles de type courant. Il décide alors de ne payer que les bou- 
teilles de qualité effectivement livrées et de refuser tout paiement pour les 
bouteilles de vin ordinaire. 


Calculez, dans cette hypothèse, la probabilité d’un bénéfice néanmoins positif pour 
le vigneron sachant que chaque bouteille de vin courant lui revient à 1,5 € et que 
chaque bouteille de vin de qualité lui revient à 3,5 <. 


Exercice 7.6 


Lors la naissance de jumeaux, on note À la probabilité qu’il s’agisse de vrais jumeaux 
et on fait les deux hypothèses suivantes : 


i) deux vrais jumeaux sont toujours de même sexe, et la probabilité qu’ils soient des 
garçons est égale à 1/2 ; 


ii) deux faux jumeaux ont des sexes indépendants et chacun des deux enfants est un 
garçon avec une probabilité égale à 1/2. 


Soit À, B et C les événements suivants relatifs à la naissance de deux jumeaux 
A= {2 garçons } 
B = {2 filles } 
C={ 1 garçon et une fille } 

1. Calculez en fonction de À les probabilités des événements À, B et C. 


Soit Y la variable aléatoire égale au nombre de fois où on a eu un garçon et une 
fille sur 1 000 naissances de jumeaux. 


Donnez en fonction de À, et en la justifiant, la loi de probabilité de la variable 
aléatoire Y. 


Donnez l’espérance et la variance de Y en fonction de À. 


3. On suppose À = 0,35 ; par quelle loi peut-on approximer la loi de  Y ? (justifiez 
votre réponse). 


Déterminez les probabilités des événements { Y > 300} et {310<Y< 350]Y > 300}. 
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Exercice 7.7 


Après avoir fait remplir un long questionnaire portant sur l’audience de la presse 
magazine à 200 individus, un institut de sondage a établi la distribution suivante pour 
la durée d’interview (en minutes) concernant ces 200 individus : 


<25 [25;30[ [30;35[ [35;40[ [40;45[ [45;:50[ 250 


Effectif 18 32 36 40 30 24 20 


1. Calculez la médiane de cette distribution. 


2. On ajuste cette distribution par une loi normale  N°(37 ; 10). Représentez le dia- 
gramme quantile-quantile. Quel jugement permet-il de porter sur la qualité de 
l’adéquation de la distribution observée à ce modèle théorique ? 


3. On suppose pour la suite de ce problème que la durée X d’une interview suit une 
loi normale N'(37 ; 10). 


3.1. Soient X;, X,,... , X, les variables aléatoires associées aux durées de n inter- 
views, on suppose les v.a. X; indépendantes et identiquement distribuées à X. 


— n 
Que représente la variable aléatoire X, = : > X,? Donnez, en la justifiant, 


n. 
i=1 
sa loi en fonction de n. 
3.2. Calculez la probabilité que la durée moyenne de 6 interviews n’excède pas 


35 minutes. 


3.3. Pour quelles valeurs de n, la durée moyenne de n interviews n’excède pas 
45 minutes avec une probabilité au moins égale à 0,99 ? 


Exercice 7.8 


Durant une année, on a observé que 70 % des actions enregistrées sur le marché bour- 
sier de Londres ont augmenté de valeur, tandis que 30 % sont restées stationnaires ou 
ont baissé. 


1. Au début de l’année, un service de conseils financiers a choisi 10 actions pour les 
placer dans la rubrique des actions « spécialement recommandées ». 


1.1. Pour un non-initié qui considérait ces 10 actions choisies aléatoirement (au 
hasard et avec remise), donnez, en la justifiant, la loi de probabilité du nom- 
bre d’actions à la hausse. 


1.2. Calculez les probabilités des événements suivants : 


— accroissement de valeur pour au moins 8 actions ; 
— accroissement de valeur pour moins de 4 actions. 


2. On considère maintenant que le service de conseils financiers a choisi 100 actions. 
Toujours pour un non-initié qui considérait ces 100 actions choisies aléatoirement 
(au hasard et avec remise), calculez, en justifiant le recours à une loi de probabilité 
approchée, les probabilités des événements suivants : 


— accroissement de valeur pour au moins 80 % des actions ; 
— accroissement de valeur pour moins de 40 % des actions. 


D'après examen de juin 2002, GEA 1 " année Paris IX-Dauphine 
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Exercice 7.9 


Un appareil électronique est soumis à des impulsions séparées par des intervalles de 
temps variables, indépendants les uns des autres. On suppose que la durée  Y (expri- 
mée en secondes) séparant deux impulsions successives est une v.a. définie ainsi 


Y=2+2X 
où À est un paramètre strictement positif et X une v.a. exponentielle de paramètre 1. 
1. Déterminez en fonction de À : 
— E(Y) et var(Ÿ) ; 
— la fonction de répartition de la variable aléatoire Y. 
2. On suppose dans cette question le paramètre À égal à 5. 
2.1. Calculez P(Y < 2) et P2<YS<S). 


2.2. Afin d'étudier si la loi théorique retenue pour Y représente bien le phénomène 
étudié, on a mesuré de façon indépendante 10 durées séparant 11 impulsions 
successives et on a obtenu les résultats suivants en secondes : 


2,3 3,5 3,9 4,7 5,1 6,8 7,9 9,6 13,1 15,5 
Tracez le diagramme quantile-quantile pour juger la qualité de l’ajustement 
de cette distribution observée par la loi retenue. Conclusion. 
Exercice 7.10 


Afin de mieux connaître sa clientèle, le gérant du cinéma Paradiso fait procéder à un 
sondage. Il obtient pour un échantillon aléatoire de taille 100 la répartition par âge 
suivante : 


Âge <15ans [15:;20[ [20;25[ [25:;30[ [30;35[ [35;40[ [40;50[ >50ans 


Effectif 4 13 22 28 15 10 5 3 


1. Calculez la moyenne et l’écart-type de cette distribution ; on supposera l’âge mini- 
mum égal à 10 ans et l’âge maximum égal à 70 ans. 


2. Calculez la médiane de cette distribution. 


3. On suppose que la distribution de l’âge des clients du cinéma Paradiso suit une loi 
normale de paramètres m = 28 ans et 6 =9,5 ans. 


3.1. Quel est le pourcentage théorique des clients qui ont entre 18et35 ans ? 


Calculez le pourcentage observé, à partir de l’échantillon de taille 100, pour 
la même classe d’âge. 


3.2. Calculez l’âge théorique À tel que 75 % des clients ait un âge supérieur à À. 


Calculez, à partir de l’échantillon, l’âge A’ tel que 75 % des individus de 
l’échantillon ait un âge supérieur à A’. Comment s’appelle cette valeur A’? 


4. Tracez le diagramme quantile-quantile pour juger la qualité de l’ajustement de la 
distribution observée par une loi normale de paramètres m = 28 ans et 6 = 9,5 ans. 


L'hypothèse précédente vous semble-t-elle justifiée ? 


Exercice 7.11 


On considère que la durée du temps d’attente T (mesuré en minutes) du bus que doit 
prendre Valérie pour se rendre à l’Université, est distribuée selon une loi exponen- 
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tielle de moyenne 5 mn, c’est-à-dire que la variable aléatoire  T admet la densité de 
probabilité suivante : 


Los nn 
FT) = 5 e si 12>0 
0 sinon 


1. Quelle est la fonction de répartition de la variable aléatoire T? 


2. Quelle est la probabilité que le temps d’attente T dépasse 8 minutes ? Dans la suite 
de l’exercice, on arrondira cette probabilité à sa première décimale. 


3. Valérie utilise le métro avec un seul ticket si elle attend le bus plus de 8 mn. Il 
faut deux tickets pour le bus, mais Valérie a une nette préférence pour le bus qu’elle 
utilise si le temps d’attente ne dépasse pas 8 mn. Soit Y, le nombre de trajets « allers » 
effectués en bus en n jours. 


3.1. Donnez, en la justifiant, la loi de y. 
3.2. Calculez son espérance et sa variance. 


4. Soit Z, la variable aléatoire égale au nombre de tickets utilisés par Valérie pour 
ses trajets « allers » en n jours. 


4.1. Déterminez la loi de Z. 
4.2. Calculez son espérance et sa variance. 
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Exercice 7.12 


Le tableau ci-dessous donne les dix meilleurs résultats nets des grandes entreprises 


françaises en 2001 (Source  : Tableaux de l'Économie Française 2003-2004, 
INSEE) : 
Société Résultats nets (millions d’€) 
TotalFinaElf 7658=x, 
Suez 2 087 = x 
PSA Peugeot Citroën 1 691 = xg 
Sanofi-Synthélabo 1 585 = x} 
Aventis 1 505 = x4 
L'Oréal 1291=x; 
Carrefour 1266 = x, 
Saint Gobain 1134 = x; 
Renault 953 = x, 
Gaz de France 891 = x; 


Soit F; la proportion d'entreprises dont les résultats nets X sont inférieurs à x, 


1. Peut-on considérer les 10 points de coordonnées {{In( x;), In(l — F;)}, i = 1 à 10} 
approximativement alignés ? (On calculera le coefficient de corrélation linéaire et 
les coefficients de la droite des moindres des carrés). 


Représentez graphiquement le nuage de ces 10 points, ainsi que la droite des 
moindres carrés. 
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2. En déduire que l’on peut ajuster la distribution de  X par une loi de Pareto de 
paramètres & et x, qu’on évaluera à l’aide des résultats précédents. 


Exercice 7.13 (suite de l’exercice 3.9) 


On choisit le modèle quadratique puisque la part de variation de Y non expliquée par 
ce modèle est plus faible qu'avec le modèle linéaire. 


On envisage un ajustement de la distribution des résidus du modèle quadratique par 
une loi de Gauss de paramètres m = 0 et 6 = 22. 


1. Calculez la série des 12 résidus de ce modèle, et rangez-les par ordre croissant. 
2. Représentez le diagramme Quantile - Quantile. 


Quel jugement permet-il de porter sur la qualité de l’adéquation de cette distribu- 
tion par la loi de Gauss envisagée ? 


D'après examen de juin 2006, DUGEAD 1"° année Paris —- Dauphine 


Exercice 7.14 


Une société de fabrication de boissons décide de lancer une nouvelle boisson à faible 
teneur en sucre. Les études effectuées montrent que la teneur X d’une bouteille d’un 
litre de cette boisson suit une loi normale de moyenne 70 g et d’écart-type 25 g. 


1. Calculez la probabilité que la teneur en sucre d’une bouteille d’un litre diffère de 
la teneur moyenne d’au plus 10 g. 


2. On choisit au hasard 25 bouteilles. Soient X1, X2, …, X)5 les variables aléatoires 
associées. On les suppose indépendantes et identiquement distribuées à X. 


25 
Que représente la variable aléatoire X = 7 D X; ? Donnez sa loi (justifier). 
i=i 
Calculez la probabilité que la teneur moyenne en sucre des 25 bouteilles diffère 
de la moyenne m = 70 g d’au plus 10 g. 


3. La société décide de modifier légèrement à la fois la composition et le procédé de 
fabrication. La variable X suit maintenant une loi normale de moyenne m et 
d’écart-type © avec m et © inconnus. Les essais conduisent aux observations 
suivantes : 


Teneur x; 40 50 60 70 80 90 100 


F; 0,11 0,23 0,40 0,60 0,77 0,89 0,96 


Déterminez les fractiles u; définis par Fy{u;) = F; où F, désigne la fonction de 
répartition de la loi normale centrée réduite. 
Représentez le nuage des points ( u;, X;). 


En déduire une évaluation de chacun des nouveaux paramètres m et 6 en utilisant 
la méthode des moindres carrés. 
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Exercice 7.15 


On donne la série statistique ordonnée des niveaux de vente d'une revue hebdoma- 
daire dans 100 points de distribution pour une semaine donnée : 


32 40 93 54 59 65 66 72 75 80 
84 85 89 93 95 95 95 101 104 105 
105 105 105 106 107 107 108 110 111 111 
112 113 113 114 114 115 116 119 119 122 
122 122 123 124 124 124 124 126 127 127 
127 127 127 129 129 130 130 130 130 130 
131 132 132 135 135 138 138 140 141 141 
142 143 143 143 144 146 147 150 152 152 
153 156 156 158 158 158 158 158 159 160 
160 162 166 166 168 170 176 192 195 196 


La moyenne de cette série d'observations est égale à 124,6 et l'écart-type à 32 


1. Déterminez les trois quartiles de cette distribution. Proposez trois indicateurs de 
tendance centrale, deux indicateurs de dispersion, et donnez leurs valeurs. 


2. On note X la variable aléatoire suivant une loi N°(125 : 30) 


2.1 Calculez la probabilité que la v.a.  X appartienne à l'intervalle centré en sa 
moyenne et de longueur égale à : 


a) 2 fois l'écart-type 
b) 4 fois l'écart-type 


2.2 Déterminez les déciles de la distribution de la v.a. X, c'est-à-dire les valeurs x; 
(1<i<)9) telles que : 
P(X < x;) = i/10 
3. Classez la distribution observée en 10 classes déterminées par les déciles x; calcu- 
lés précédemment (question 2.2). 


4. Comparez à l’aide d’un diagramme les fréquences cumulées observées avec les 
fréquences cumulées théoriques (probabilités cumulées en pourcentage) pour 
apprécier la qualité de l'ajustement de la distribution observée par la loi.N'(125 ; 30). 
Conclusion. 


D'après examen de septembre 2009, DÉGEAD 1 "* année Paris —- Dauphine 
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R éponses aux 
questionnaires 
« Testez-vous » 


Chapitre 1 


1. Bonnes réponses : b) et c) 

Trois quartiles séparent l’intervalle de variation [min( X), max(X)] en quatre intervalles 
contenant chacun le quart de l’effectif, donc 75 % des observations sont supérieures au 
1° quartile. 

2. Bonnes réponses : a), b) et d) 

La boîte de distribution contient 50 % des observations et la médiane, égale à la moyenne, 
est le milieu de l’intervalle interquartile. 

3. Bonnes réponses : c) et d) 

On ne peut utiliser dans ce cas que des caractéristiques indépendantes des unités. 


4. Bonnes réponses : a) et b) 

La médiane de la série des écarts absolus à la moyenne est une mesure de la dispersion ; 
les quartiles Qj et O3 sont des indicateurs de position, mais non de tendance centrale. 

5. Bonnes réponses : c) et d) 


Pour calculer la note moyenne et l’écart-type des deux classes réunies, il faut utiliser des 
formules avec des pondérations ($ IIL.B.1 pour la propriété 4 de la moyenne et $ III.C.4 
pour la propriété 4 de la variance). 

L'écart absolu moyen à la médiane est le plus petit écart absolu moyen ($IIL.C.3), d’autre 
part, l’écart-type est toujours supérieur à l’écart absolu moyen à la moyenne arithmétique 
($ IIL.C.4), donc, l’écart absolu moyen des notes à la médiane est au plus égal à 4 pour 

la classe 1. 


6. Bonnes réponses : a) et d) 


7. Bonne réponse : c) 
Se référer à la moyenne géométrique ($ IIL.B.2). 
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8. Bonnes réponses : b) et c) 


9. Bonnes réponses : a) et c) 


Chapitre 2 


1. Bonne réponse : b) 


L'indice des prix actuellement calculé par l'INSEE est un indice-chaîne de Laspeyres. 


2. Bonne réponse : c) 


Un indice de Paasche est souvent un indice des quantités, mais il peut aussi être un indice 
des prix ($ IL.A). 


L'indice de Paasche est souvent inférieur à l’indice de Laspeyres, mais les pondérations 
de ces deux indices n’étant pas les mêmes, il est possible que cette propriété ne soit pas 
vérifiée ($ IL.C). 

3. Bonnes réponses : a), b) et c) 

Un indice des dépenses ou du coût de la vie sert à mesurer l’évolution du niveau des 
dépenses de consommation entre deux périodes distinctes. 

S'agissant des sommes à débourser par un ménage compte tenu des prix, mais aussi des 
quantités achetées, c’est un indice de valeur qui est donc réversible et transitif. 

4. Bonnes réponses : a), b) et d) 

Le taux annuel moyen de variation peut être déterminé graphiquement en utilisant une 
représentation graphique avec une ordonnée logarithmique ($ IV.A). 

5. Bonnes réponses : c) et d) 


Le taux de croissance pour période 1999-2001 est égal à 
1,029 : 1,038 - 1,021 -1 9% 


Chapitre 3 


1. Bonnes réponses : a) et d) 


2. Bonnes réponses : a), b) et c) 


On a deux variables liées par une relation linéaire inverse, leur coefficient de corrélation 
linéaire est égal à — 1 et les pentes des deux droites des moindres sont négatives. 
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3. Bonnes réponses : a) et b) 

Le nuage de points est formé de 2 points, et par 2 points, on peut faire passer une droite, 
la représentation graphique nous montre que la droite est de pente positive, on a donc 
r=+1l 

4. Bonne réponse : c) 


Cette question a pour objectif de sensibiliser à l’attention qui doit être nécessairement 
portée à la signification des variables ($ ILE). 


5. Bonnes réponses : b), c) et d) 


On a un tableau de profils en colonne. 


6. Bonnes réponses : a), b) et d) 

La moyenne X est une moyenne pondérée des moyennes conditionnelles ($ I.C) ; en ce qui 
concerne les moyennes conditionnelles, elles s’obtiennent à partir du tableau de contin- 
gence, ou à partir du tableau des profils en lignes pour les moyennes conditionnelles de 

Y à X fixé et du tableau des profils en colonnes pour les moyennes conditionnelles de X 
à Y fixé. 

7. Bonnes réponses : a), b) et d) 


Si a = 20 et b = 5, il y a indépendance puisque les profils en colonnes sont identiques 


(r = 0). 
Si a =0et b = 0, alors on a seulement deux observations différentes sur deux variables 
et dans ce cas, r = +1 puisque le nuage de points est réduit à deux points (ici r =-—1). 


Si a = 0 et b = 10, il n’y a ni indépendance, ni liaison linéaire, donc r Z+ let r Z0 (en 
fait r = — 0,5). 

Si a = 10 et b = 10, il y a indépendance puisque les profils en lignes sont identiques. 

8. Bonne réponse : d) 


Lorsqu'on connaît les marges, il suffit de connaître ( k— 1): (/— 1) effectifs du tableau 
de contingencedu fait des liaisons entre les effectifs marginaux et les effectifs du tableau ; 
le nombre (k— 1) : (1— 1) est appelée nombre de degrés de liberté. 


9. Bonnes réponses : a), c) et d) 


26 % des malades ont pris un somnifère ef ont bien dormi. 


10. Bonnes réponses : a) et d) 


On a un tableau de profils en colonnes. Si les deux variables nominales étaient indépen- 
dantes, les deux profils-colonnes seraient identiques. 


Les pourcentages de deux lignes ne s’aditionnent pas. Pour calculer le pourcentage total 
des salariés (hommes et femmes réunis), il faut utiliser les effectifs (total des emplois). 


On obtient pour les non-salariés : 
(13,4 - 13 670 + 7,3 -12 243)/(13 670 + 12 243) = 10,5 
Et pour les salariés : 
(86,6 : 13 670 + 92,7 - 12 243)/(13 670 + 12 243) = 89,5 
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Chapitre 4 


1. Bonnes réponses : a), c) et d) 


I ya(T-p +1) moyennes mobiles centrées de longueur impaire p et (T —-p) moyennes 
mobiles centrées de longueur paire p. 


2. Bonne réponse : b) et d) 


Si le facteur saisonnier est proportionnel à la tendance, on choisit le modèle multiplicatif, 
et dans ce cas, la courbe joignant les maxima est à peu près parallèle à celle qui joint les 
minima sur un graphique à ordonnée logarithmique ($ ID). 

Des maxima distants de 5 dates peuvent indiquer une composante saisonnière de période 
5, mais cette seule information n’est pas suffisante pour choisir le modèle adapté. 


3. Bonnes réponses : a) et b) 


La moyenne mobile centrée de longueur  p rend constante les séries périodiques de 
période p et de période sous-multiple de p. 

La moyenne mobile centrée de longueur 2  p éliminent la composante saisonnière de 
période p puisque la somme des coefficients saisonniers sur une période est nulle. 

La somme de p termes successifs divisée par p donne une évaluation de la tendance pour 
la date correspondant à celle du terme du milieu des p termes. 

On peut calculer (T — p) moyennes mobiles centrées de longueur p si p est pair, et (T —p + 1) 
moyennes mobiles centrées de longueur p si p est impair, on a donc toujours au moins ( T—p) 
moyennes mobiles centrées. 


4. Bonnes réponses : c) et d) 


Le lissage exponentiel simple ne peut s’envisager que pour une chronique sans saisonna- 
lité et sans évolution tendancielle ; la prévision tient d’autant plus compte des valeurs 
récentes de la série que la constante de lissage ot est élevée. 


Chapitre 5 


1. Bonnes réponses : a) et d) 
2. Bonnes réponses : a) et b) 
3. Bonne réponse : c) 


4. Bonnes réponses : b) et d) 
Car P(AUB) = P(A) + P(B) - P(ANB) et À et B étant indépendants, P(ANB) = P(A) : P(B) 
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5. Bonnes réponses : c) et d) 
Soit À l’événement /e lièvre est touché par au moins un des chasseurs , alors 
P(A)=1- P(A) 


6. Bonnes réponses : c) et d) 
7. Bonnes réponses : a), b) et d) 
8. Bonnes réponses : b) et c) 


9. Bonnes réponses : a) et d) 


Seule la loi de probabilité d’une variable aléatoire continue est définie par une fonction 
de densité. 


10. Bonnes réponses : b) et c) 


11. Bonne réponse : a) 


La réponse d) est vraie si a est positif. 
12. Bonnes réponses : a), b) et d) 

13. Bonnes réponses : a) et c) 

14. Bonnes réponses : a) et c) 


15. Bonnes réponses : a), b) et c) 

Puisque P{(X=x)N(Y=3)}=P(X= x) Y =): P(Y=7;) 

on peut calculer la loi jointe ; 

P(X=1) = P(X=1|Y=1) P(Y=1)+P(X=1|Y=2):P(Y =2) 
+P(X=1|Y=3):P(Y=3)=0,2 


16. Bonnes réponses : a), b) et c) 


17. Bonne réponse : a) 


Pour spécifier la loi jointe, il faut connaître en sus des _k lois conditionnelles { Y|X = x;} 
la loi marginale de X, ou en sus des / lois conditionnelles {X} Y = »j} la loi marginale de Y. 


Chapitres 6et7 


1. Bonnes réponses : a), c) et d) 
2. Bonnes réponses : a) et b) 


3. Bonnes réponses : a), b) et d) 
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4. Bonnes réponses : a) et b) 
5. Bonnes réponses : a) et b) 


6. Bonnes réponses : b), c) et d) 


La loi (60 ; 0,05) peut être approchée par une loi P(3) 
= P(X23)=1- P(X< 2) = 0,5768 
sin=4 etp=0,01: P(X=0)= (0,99) = 0,96 
sin=50et p=0,08: P(3<X<10)=P(X< 10) - P(X< 3) =0,573 


7. Bonne réponse : a) 
8. Bonne réponse : c) 


9. Bonnes réponses : b), c) et d) 


P(X = 2) = 0, car pour une variable aléatoire continue, la probabilité d’un point est nulle. 
10. Bonnes réponses : a) et b) 


11. Bonnes réponses : a), b) et c) 


Les v.a. X et Y étant indépendantes, leur coeficient de corrélation linéaire est nul. 
12. Bonnes réponses : b), c), et d) 


13. Bonnes réponses : a), c) et d) 

On peut approcher la loi de Y par une loi de Gauss, X et Y étant indépendantes, la v.a. 
(X + Y) suit approximativement une loi de Gauss puisque la somme de deux variables 
aléatoires gaussiennes indépendantes est gaussienne . 

14. Bonnes réponses : a), b) et c) 


E(X2) = var(X) + (E(X)}? = 10 


15. Bonne réponse : a) 

Pour une v.a. exponentielle, l’espérance est égale à l’écart-type et ses valeurs possibles 
sont supérieures à 6, donc à 0. 

16. Bonne réponse : b) 

Une somme de variables aléatoires binomiales indépendantes suit une loi binomiale si 
tous les paramètres p; sont égaux. 


17. Bonnes réponses : a), b), c) et d) 


18. Bonnes réponses : a) et b) 


La demande du produit pour 25 jours de fonctionnement suit une loi mA 000 ; 0,05), et on 
est dans les conditions d’approximation par la loi normale et aussi par la loi de Poisson. 
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Corrigés 


des exercices * 


Chapitre 1 


Exercice 1.1 


1. 


Population : formée des 5 sous-populations (non disjointes) de l’ensemble des familles 
en France en 1968, 1975, 1982, 1990 et 1999 . 

Unité statistique : une famille parmi cet ensemble de familles . 

Caractère étudié : nombre d’enfants de 0 à 18 ans en milliers, caractère quantitatif discret. 


Le nombre total de familles, le nombre de familles sans enfant, le nombre de familles 
avec 1 enfant, le nombre de familles avec 2 enfants augmentent au cours de la période 
1968-1999, tandis que le nombre de familles de 4 enfants et le nombre de familles de 
5 enfants ou plus diminuent. Le nombre total d’enfants augmente de 1968 à 1975, et 
diminue ensuite. 


Pour tracer les diagrammes en bâtons, il est préférable d’utiliser les distributions de 
fréquences (en %). 


1968 1975 1982 1990 1999 
Familles avec enfants 6 760 7 340 7 610 7 491 7 418 
1 enfant 40,3 42,4 43,4 43,8 44,7 
2 enfants 30,4 32,3 35,9 36,8 37,4 
3 enfants 15,7 14,8 14,2 14,2 13,6 
4 enfants 7,1 5,8 4,1 3,5 3,1 
5 enfants ou plus 6,5 4,7 2,4 1,8 1,2 
Total fréquences 100 100 100 100 100 
Nombre total d’enfants 14 569 14 826 14 294 13 748 13 308 
Moyenne 2,16 2,02 1,88 1,84 1,79 
Écart-type 1,88 1,58 1,14 1,01 0,89 


Mode de chaque distribution : « 1 enfant » 


Le nombre de familles nombreuses diminuant, la dispersion autour de la valeur moyenne 
diminue. 


* Les onglets renvoient au chapitre du cours correspondant. 
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1968 1999 


50 50 
40 40 
30 30 
20 20 
10 10 
0 0 
1 2 3 4 5 1 2 3 4 5 
Nombre d'enfants Nombre d'enfants 


Diagrammes en bâtons juxtaposés 


1 2 3 4 5 
Nombre d'enfants 


Exercice 1.2 


1. Population : formée de 7 sous-populations associées chacune à une année (2000 à 
2006) ; l’ensemble des jours d’une année constitue la population de l’année. 
Unité statistique : une journée d’une année. 

Caractère étudié : niveau de l’indice de la qualité de l’air, caractère qualitatif, mais 
aussi ordinal (les modalités du caractère sont ordonnées). 


2. Diagramme en bâtons de la distribution 2006 : mode = « niveau 3 ». 
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100 
80 
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40 
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0 
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Année 2000 2001 2002 2003 2004 2005 2006 | 2000-2006 


Niveau moyen 3,6 3,7 37 4,1 3,6 3,6 3,7 37 


Le niveau moyen a été particulièrement élevé en 2003. 


Exercice 1.3 


1 5 =07 G=10 A elll es 


Meg=10 Mep=10+2: 


25-10 _ ;52 
25 


Pour une distribution symétrique, la moyenne est égale à la médiane. 
2 KR =0: 24 +07: = 10,605 10,7 


3. Tous les indicateurs sont multipliés par 10 


Exercice 1.4 


1. Population : le personnel ouvrier d’un secteur industriel. 
Unité statistique : un homme ou une femme de ce personnel. 
Caractère étudié : le salaire annuel net en euros, variable statistique continue. 


2. 
a) On peut en fait proposer 4 indicateurs de tendance centrale : 


xy =15400€  Me=14 800€ 
(Q1 + 03)/2=15 205€ (D, + Do)2= 15 585€ 
b) On peut en fait proposer 3 indicateurs de dispersion : 
Sy=360€ (Q3-Q)=49I0€ (Do-D;,)=9 270€ 
c) On peut en fait proposer 3 indicateurs de dispersion relative : 


sul Xn =0235 (Q3-Q)/Me=0,332  (Do- D;)/ Me = 0,626 


11-82+13-34+15-12+18- n4=12-(128+ n4) 


1524 1536 
= n=2 = N=130 


4 sp=1509€ sp/xr = 0,125 


180 : x,, + 130 - x, 
D de mens | OA € 
310 
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Exercice 1.5 


Appelons x le coût total de la main d'œuvre : 
coût total : x 1 
— moyenne harmonique pondérée 


Exercice 1.6 


L 


B,: 19/(1,12)/(1,08)*(1,06)* = 1,0798 = 1,08 


— taux de croissance moyen = 8 % 


B,: 19/(1,1)°(1,08)*(1,07)* = 19/23 = 1,0819 = 1,082 
= taux de croissance moyen = 8,2 % 


2. La banque B, est la moins performante. Soit x son taux durant la 3° période. On peut 
calculer x pour que le taux moyen de croissance égale celui de la banque B; : 
(1,122 (108 (1+x)#=22 = x+6,5% 
Exercice 1.7 


1. Population : les 30 premiers groupes français de l’industrie et des services selon leur 
CAHT en 2001. 


Unité statistique : un groupe parmi les 30 premiers groupes français de l’industrie et 
des services selon leur CAHT en 2001. 


Caractères étudiés : deux caractères quantitatifs, le CAT en millions d’€ et l’effectif. 
2. CA:n=30 

X = 30 000 millions d’€ sx = 19 729 millions d’€ 

Effectif : n = 30 

3 =134448 sy= 87 248 


3.1. 


n=30 —=  P(Me)=155 — Me =23 197 millions d’€ 
P(Q)=8 —  Qj=16 667 millions d’€ et Q3 = 37 200 millions d’€ 
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3.2. et 3.3. Graphiques SPSS 


Frequency  Stem & Leaf 122 180 
6,00 1. 334444 XTotalFinaElf 
4,00 1. 5677 100 000 
6,00 2. 000123 
4,00 2. 5567 80 000 
1,00 3 : 0 Carrefour 
2,00 3. 67 60 000 
3,00 4. 023 
,00 4 . 40 000 
1,00 5.1 
1,00 5 À 7 20 000 
2,00  Extremes (> = 69 486) 
Stem width : 10 000 0 
Each leaf : 1 case(s) ne je 


CAMHT (millions d'€) 


. Le diagramme « branche et feuille » ne peut s’envisager que pour des distributions de 
population de taille peu élevée, contrairement à l’histogramme où l’hypothèse d’équi- 
répartition à l’intérieur des classes n’est réaliste qu’avec un effectif suffisant dans cha- 
que classe. Cette représentation permet de plus de ne pas perdre l’information valeur 
par valeur et aussi d’étiqueter éventuellement les observations. 
La boîte de distribution met en évidence une valeur éloignée (Carrefour) et une valeur 
extrême (TotalFinaElf). Cette distribution asymétrique étalée vers les valeurs élevées 
sera modélisée par la loi de Pareto au chapitre 7, $ IV.B. 
5.1. La série étant ordonnée selon le CA, il faut maintenant l’ordonner selon l’effectif 
n = 30 =  P(Me)j=155 —  Me=120 510 
P(Q)=8 —  Qj1=82892et O3 = 173 329 
5.2. et 5.3. Graphiques SPSS 
La boîte de distribution met en évidence trois valeurs éloignées : Carrefour, 
Vivendi Universal et La Poste. 


Frequency  Stem & Leaf 


Oarrefour 
5,00 0. 02234 
5,00 0. 57899 Erpaihumirent 
11,00 1. 00111222234 
4,00 1. 6789 
2,00 2. 02 
3,00  Extremes (> = 313854) 
Stem width : 100 000 
Each leaf : 1 case(s) 


N= 30 
EFFECTIF 
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Exercice 1.8 


1 


Population : ensemble des ménages en France en 1999 . 

Unité statistique : un ménage en France en 1999. 

Caractère étudié : le revenu annuel en euros, hors revenus du patrimoine quantitatif 
continu. 


j = 
X = — X; = 25 255 
10 > | 
i=1 
Les moyennes n’étant pas égales aux centres des classes, l'hypothèse d’équiréparti- 
tion n’est pas justifiée. 


Indicateurs de tendance centrale : x = 25 255 , Me = Ds = 20 631, (Do + D,)/2 = 26 973 
Indicateur de dispersion : Do — D; = 39 338 
Indicateur de dispersion relative : (Do — D;)D; = 1,9 


Distribution asymétrique étalée vers les valeurs élevées, car la médiane est inférieure 
à la moyenne (et on a aussi Me < (D, + D,)/2). Les distributions de revenus (ou de 
salaires) sont toujours asymétriques et étalées vers les valeurs élevées. 


Indicateur de disparité des revenus : Dy/D; = 6,4 
= les 10 % les mieux lotis perçoivent plus de 6 fois plus que les 10 % les moins bien 
lotis. 


16 % des revenus sont perçus par les 4 dixièmes des ménages aux revenus les plus 
faibles. 


Courbe de concentration ou courbe de Lorenz 


F;(%) 10 20 30 40 50 60 70 80 90 100 
R;(%) 2 5 10 16 23 32 43 56 72 100 


0 T T T T T T T T T 1 


O0 10 20 30 40 50 60 70 80 90 100 
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L'indice de Gini mesure ici la concentration des revenus des ménages. Il est égal au 
double de l’aire comprise entre la courbe de concentration et la bissectrice. 

Cet indice est compris entre 0 et 1. 

La valeur minimum 0 correspond au cas où la courbe est confondue avec la bissec- 
trice et au cas de l’équirépartition : tous les individus ont une part égale du revenu. 
La courbe s’éloigne de la bissectrice lorsque l’inégalité s’accroît. 

À contrario, si un seul ménage détient la totalité du revenu, tous les autres ayant un 
revenu nul, l’indice de Gini vaut 1. Dans cette situation, la courbe est confondue avec 
les côtés du carré : axe des abscisses et segment vertical reliant le point {100 : 0} au 
point {100 ; 100}. 


Exercice 1.9 


1. Population : les exploitations agricoles de France métropolitaine en 1979, 1988, 2000 
et 2005 
Unité statistique : une exploitation agricole de France métropolitaine en 1979, 1988, 
2000 et 2005 


Caractère étudié : la taille de la SAU, variable statistique continue 


2. Soit c;, c, et c; les taux annuels moyens de variation au cours de chacune des 
3 périodes : 


1017 


G+ en? = LOT = (0.80522)° = ci = - 24 % 
> _ 664 
( + C2)!2 — 1017 = (0,65290) 2 = Ce — 3,5 % 
545 


(1 + c3} = (0,96127)$ = c3 + —3,9 % 


664 


Le taux annuel moyen de variation c de 1979 à 2005 est une moyenne géométrique 


pondérée des 3 taux c;, cetc3:1+c= 26/1 +c) - (1 4e)” -(1 +c;) 


545 
1+c= 26} 
> 1+0C 26 1 263 


= 0,96819 = c=-32 % 


1979 1988 2000 2005 


SAU moyenne 23 28 42 50 


SAU moyenne des exploitations de 50 ha ou plus 88 90 106 112 


Le nombre des exploitations agricoles diminue, la taille moyenne des SAU augmente, 
ainsi que la taille moyenne des exploitations de 50 ha ou plus. 


4. Le centre de la dernière classe étant par hypothèse la SAU moyenne des exploitations 


de 200 ha ou plus est égale en 2005 à 280 (= 4 762/17). On évalue ainsi la SAU maxi- 
mum approximativement à 360 ha. 
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L’histogramme comporte 6 classes : 6 rectangles de hauteur f /a;. 


Taille de SAU [0, 5[ [5, 20[ [20, 50[ | [50, 100[ | [100, 200[ | [200, 360! 
f 24,2 19;1 20,0 20,7 12,8 3,1 
f;/a; 4,844 1,272 0,667 0,415 0,128 0,019 

Ji/ai 
5 
4 
3 
2 
1 
0 
0 50 100 150 200 250 300 350 400 


Pour construire un histogramme à classes inégales, se reporter à la page 


EXCEL’ENSE du n° 


(www.modulad.fr). 


Courbe de concentration 


34 de la revue 


Modulad, « Réaliser un histogramme  » 
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Pi(%) 0 24,2 43,3 63,3 84,0 96,9 100 
qi (%) 0 1,0 5,2 | 18,7 48,1 | 82,7 | 100 

100 

80 

60 

40 

20 

0 

0 20 40 60 80 100 


Chapitre 2 


Exercice 2.1 


L els = 112,5 ie (p) = 140 Fée (p) = 


2. La moyenne arithmétique des indices élémentaires pondérée par la part des dépenses 
engagées par l’entreprise pour chacune des matières premières en 2000, est l’indice 
de Laspeyres des prix en 2004, base 2000. 
Dépense 2000 = 8 000 + 2 000 + 3 000 = 13 000 


8.000 2 000 3 000 
.112,5 + 2000 . 1494 3000. 160 2 113.8 
LosooP) = 33 506 * 13 000 13 000 
“oo 7 F 000? à de es: L 
L = 8000 66, 2000 569 4 3000. 560 = 
4000 = 13 506 * 13 006 13000 00 T7 


4. Dépense 2004 = 5 400 + 2 800 + 4 800 = 13 000  —  Zosgp (v) = 100 


5. Taux de variation des prix : 13,8 % 
Taux de variation des quantités : — 10,8 % 
Taux de variation des dépenses : 0% 


La non-variation de la dépense totale s’explique par une compensation entre les évo- 
lutions des prix et des quantités consommées  : diminution de la quantité de matière 
première À dont le prix a augmenté, stagnation de la quantité de matière première B 
dont le prix a augmenté, et augmentation de la quantité de matière première C dont 
le prix a stagné. 


Exercice 2.2 
1. Soit c le taux annuel moyen de variation pendant entre 1980 et 2000 : 


. 168 


E .(1+0,06)” = 3,275 = (1,061)? = c=6,1% 


tie sis 


Exercice 2.3 


Soit c, le taux trimestriel moyen de croissance entre le 31 décembre 1998 et Le 30 sep- 
tembre 2009 : 

(A+ c,)# =1,4145 = (1,0081)5 — taux trimestriel moyen de croissance = 0,81 % 
Soit c, le taux annuel moyen de croissance entre le 31 décembre 1998 et le 30 septembre 
2008 : 

(1 + c)19 = 1,3908 =(1,0335)!9 — taux annuel moyen de croissance = 3,35 % 


Exercice 2.4 


1. Indice de valeur de la production des « Produits végétaux » 2008/2007 = 99,7 
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Indice de valeur de la production des « Oléagineux, protéagineux » 3008/2007 = 103,2 


Indice de valeur de la production des « Vins » 5908/2007 = 97,9 


2. Évolution 2008/2007 des prix à la production des « Produits végétaux » 
= 99,7/103,6-1 = 0,038 =-3,8 % 
Évolution 2008/2007 des prix à la production des « Oléagineux, protéagineux » 
= 103,2/104,8 — 1 = 0,015 =-1,5 % 
3. Évolution 2008/2007 du volume de la production des « Vins » 
= 97,9/103,7 — 1 = 0,056 = —5,6 % 
4. La diminution en valeur de la production de « Produits végétaux » entre 2007 et 2008 


est due à une diminution des prix qui n’a pas été totalement compensée par l’augmenta- 
tion du volume de la production. 


L'augmentation en valeur de la production des « Oléagineux, protéagineux » entre 2007 
et 2008 est due à l’augmentation du volume de la production qui a plus que compensé la 
diminution des prix. 


La diminution en valeur de la production de « Vins » entre 2007 et 2008 est due à une 
diminution du volume de la production qui n’a pas été totalement compensée par l’aug- 
mentation des prix. 


Exercice 2.5 
1. La variation relative de la consommation médicale entre 1970 et 2000 peut s'écrire 


sous forme d'indice, elle est alors égale au rapport (multiplié par 100) de la consom- 
mation en 2000 par la consommation en 1970 : (123,545/6,494)-100-1 902,4 


2. 

Année | Indice 1970 = 100 | Année | Indice 1970 = 100 | Année | Indice 1970 = 100 
1970 100 

1971 115,7 1981 545,1 1991 1 346,2 
1972 131,9 1982 633,6 1992 1 439,4 
1973 151,4 1983 721,4 1993 1 519,2 
1974 178,4 1984 800,7 1994 1 568,5 
1975 222,5 1985 878,4 1995 1 636,2 
1976 258,9 1986 950,2 1996 1 682,2 
1977 289,7 1987 997,4 1997 1710,1 
1978 347,2 1988 1 084,7 1998 1 735,8 
1979 401,6 1989 1 176,1 1999 1 803,0 
1980 465,3 1990 1 261,3 2000 1 902,4 
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3. et 4. 


Indice de la consommation médicale totale Indice de la consommation médicale totale 
base 100 en 1970 base 100 en 1970 


« 


2100 
1900 
1700 
1500 1 
1300 
1100 1 
900 
700 4 
500 
300 
100 
1970 1980 1990 2000 1970 1980 1990 2000 


Figure 1 - Ordonnée logarithme Figure 2 - Ordonnée arithmétique 


10000 


1000 


100 


Pendant la période 1970-1982, les points sont quasi alignés, le taux annuel de croissance 
c de l'indice est donc quasi constant et égal à la pente de la droite joignant les deux points 
extrêmes (cf. figure 1) : 


G+c) 226336 = c=12/6336-1 = c = 166% 


Entre 1982 et 2000, l’évolution n’est plus exponentielle, mais quasi-linéaire avec une 
augmentation annuelle moyenne de l’indice égale à la pente de la droite joignant les deux 
points extrêmes (cf. figure 2) : 


a = ((CM000 - CM082)/ CM 070) : 100/18 = (1902,4 — 633,6)/18 = 70,5 % 


= L'indice de la consommation médicale est passé d’une évolution exponentielle avec 
un taux annuel moyen de croissance de 16,6 % à une évolution quasi-linéaire avec une 
augmentation annuelle moyenne égale à 70,5 %. 


5. Tenir compte de la variation des prix permet de passer d’un indice de valeur à un 
indice de volume et d'évaluer le taux annuel moyen de croissance du volume de la 
consommation entre 1970 et 1982 en s'affranchissant de l'illusion monétaire : 


IndiceCMg) 70: 100/3,187 = 1988 — oc’ = l4/1988-1 = 59% 


Entre 1982 et 2000, l’évolution n’est plus exponentielle, mais linéaire et on peut cal- 
culer l’augmentation annuelle moyenne de l’indice de volume : 


a= [| CM000 _ CMio8 | 00 CMis70 
18 5,584 182 /70 


Il …- CMoo/70  /ndice CM; ,70 | 


"18 5,584 Fe 
_1 (1902,4 633,6 
18 (5,584 3,187 


= (340,7-198,8)/18 = 7,9 % 
( ] 
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6. En déflatant, on est passé, sur la période 1970-1982, d’un taux annuel moyen de crois- 


sance de 16,6 % pour l’indice de valeur à un taux annuel moyen de croissance de 
5,9 % pour l'indice de volume, et sur la période 1982-2000, d’une augmentation 
annuelle moyenne de 70,5 % pour l’indice de valeur à une augmentation annuelle 
moyenne de 7,9 % pour l’indice de volume. 


Chapitre 3 


Exercice 3.1 


1. Population : 30 000 assurés pour le risque « véhicules à moteur ». 
Caractères étudiés : puissance fiscale, variable statistique discrète, 


kilométrage parcouru la dernière année, variable statistique continue. 


2. Distribution marginale de Y 


Y milliers de km < 10 [10 ; 20[ [20 ; 30! [30 ; 40[ > 40 


f.; 14% 17 20 33% 16% 


D’après l’énoncé : 1'° classe — [2 ; 10[ dernière classe — [40 ; 50[ 
3 = 27 140 km sy = 12 648 km 


Me = 20 + 10 . 2 


= 29,5 milliers de km = 29 500 km 


3. La distribution du kilométrage parcouru par les possesseurs d’une voiture d’une puis- 
sance fiscale d’au plus 6 CV est une distribution conditionnelle : 


YIX <6 <10 [10 ; 201 [20 ; 30[ [30 ; 40[ > 40 
Fréquence 41,4 35,0 14,3 9,3 0 
(%) 
11,6 9,8 4,0 (2$ ) 
229.100 22.100 2.100 = - 100 
( 28 ) (Si ) (5 ) 28 


Exercice 3.2 


1. Population : les 100 salariées femmes et les 140 salariés homme d’une entreprise. 
Unité statistique : un homme ou une femme parmi les 240 salariés. 
Caractères étudiés : le salaire mensuel en euros, variable statistique continue, 
l’ancienneté exprimée en années, variable statistique continue. 


2. Parmi les 50 femmes ayant moins de 8 ans d’ancienneté, 44 gagnent moins de 2200 € : 
44:100/50=88 % 
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3. Femmes: x, =2000€ s,=548€ 
Hommes : Fa =2508€ s,=697,50€ 


nj'Xj+M:X 


Ensemble : x = = 2296€ 


A+ 
4. Moyenne et écart-type de l’ancienneté des femmes (en années) : ÿ =9,8 sy=6,7 


5. Graphe des fréquences cumulées : ligne brisée qui joint les points ( y;, F;) 


Y <0 4 8 12 20 > 28 
F;(%) 0 20 50 70 90 100 
F, 
__eE A ———— 
Yi 
24 28 32 
6. 
Y|X 2 1 800 [0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 20[ [20 ; 28. 
Fréquence 13,3 33,3 16,7 20 16,7 
(%) (8/60) (20/60) (10/60) (12/60) (10/60) 


, s 6,7 
7. à =r. À 20,45. 22 
ne 548 


Point d’intersection : (x, y) = (2 000 ; 9,8) 


=0,0055 D = ÿ-à-x = 9,8 — 0,0055 - 2000 = — 1,2 
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Exercice 3.3 


1. Indice PIB en 1991 = Indice 1990 (1 + variation 1991/100) = 102,6 (1 + 1/100) = 103,6 


D4 = # =D3*(1+54/100) 
A B C RE 

L11 Année Variation PIF Variation Consommañion Indice PIB Indice Consommation 
(12 1989 100 100 

3 1990 2,6 sh 102.6 102,5 
[4] 1991 1 0,6 [ 103,6 l 103,1 
(ESRI 1992 1,4 1 105,1 104,1 
161 1993 -0,9 -0,4 104,1 103,7 
2] 1994 2,2 1,4 106,4 105,2 
18. 1995 2,1 1,7 108,7 107,0 
LIN 1996 11 1,6 109,9 108,7 
[10 | 1997 2,2 0,4 112,3 109,1 
111] 1998 3,2 3,9 116,2 113,4 
112] 1999 373 33 120,0 117 
113 2000 37 3,6 124,7 121,6 
114 2001 1,9 2,6 127,1 124,7 
115 | 2002 ul 2,4 128,4 127,7 
116 2003 1,1 2 129,8 130,3 
117] 2004 2 FE 133,0 133,5 
16 2005 1,9 2,6 135,5 137,0 
119] 2006 2,2 2,4 138,5 140,3 
|20 | 2007 2,3 FE 141,7 143,8 
L21 | 2008 0,4 Î 142,3 145,2 
|22 | 2009 -2,2 0,8 139,1 146,4 


r=0,992 =1 — liaison approximativement linéaire 


2. et 3. 
à =1,09 b=-11,40 (résultat à obtenir avec une calculatrice ou avec Excel®) 


Calcul du coefficient de corrélation linéaire et des coefficients de la droite des moin- 
dres carrés avec Excel : 


r_= COEFFICIENT.CORRELATION(D2:D22;E2:E22) 
à = INDEX(DROITEREG(E2:E22;D2:D22);1) 


A 


b = INDEX(DROITEREG(E2:E22;D2:D22):2) 


La part de variation de Y expliquée par la relation linéaire est égale à 7?, soit 98 %. 
X°= variation en volume du PIB 
Y”= variation en volume de la consommation privée 


rAX°Y) = 0,563 = (0,75)2 
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Indice Consommation Variation Consommation 
150 


y=1,0929x- 11,397 


140 r= 0,984 4 + 
v=0,595$1x+ 0,9333 . * 
r=0,5633 
130 
120 
110 
100 + + -3 2 ft F2 RMS 
100 110 120 130 140 150 lariali 
Indice PIB Variation PIB 


Pour obtenir et tracer avec Excel la droite des moindres carrés qui ajuste le nuage de 
points : 


Onglet « Graphique », « Ajouter une courbe de tendance », type « Linéaire », option 
« Afficher l’équation sur le graphique », et « Afficher le coefficient de détermination 
(R2) sur le graphique » 


Les variables indice de volume du PIB et indice de volume de la consommation privée 
sont liées linéairement au temps : 
r? (indice PIB, temps) = 0,974 
r2 (indice Consommation, temps) = 0,964 


La liaison linéaire entre ces deux indices est due à leur liaison linéaire avec une même 
3° variable qui est le temps. 


L'étude des variations relatives permet d’éliminer la tendance. On dit alors qu’on a 
« stationnarisé » les séries. 


Exercice 3.4 
1. 810/1 000 = 81 
2. 440/810=-543 % 


* Pas du tout | Plutôt pas Plutôt Très Total 
satisfait satisfait satisfait | satisfait 1 
> 2 ans d’ancienneté 10 50 245 195 500 
<2 ans d’ancienneté 40 90 205 165 500 
Profils en ligne en pourcentage : 
> 2 ans d’ancienneté 2 10 49 39 100 
<2 ans d’ancienneté 8 18 41 33 100 


CORRIGÉS DES EXERCICES e 303 


Pas du tout ou plutôt satisfait Plutôt ou très satisfait 
> 2 ans d’ancienneté 60 440 
<2 ans d’ancienneté 130 370 
500 : 810 
5 ny, = ——— = 405 
1 1 000 


Exercice 3.5 


1. 
2. 


r=—0,928 à =—-0,018 b = 3,513 (utilisation d’une calculatrice) 


3 =—0,018 - x + 3,513 
Les deux droites des moindres carrés ont des pentes de même signe. 


Recette globale = 1 000:x-y=-18-x2+3513:x 
> 9R =-18-2x+3513 —= 9R = 0 pour x, = 96,3 tonnes 
ox ox 


La recette globale est une fonction croissante de x entre [0 , x,] et décroissante pour 
XX 

— la valeur critique que les producteurs ont intérêt à ne pas dépasser est la valeur : 
x, = 96,3 tonnes 


Exercice 3.6 


1. 


Population : les n ménages (hors étudiants) interrogés pour l’enquête logement 1996 
de l'INSEE. 

Unité statistique : un ménage parmi les n ménages interrogés. 

Caractères : niveau de vie en F/uc/mois (quantitatif continu), type socio-économique 
(qualitatif). 


Profils en ligne et profils en colonne, ou distributions conditionnelles selon le niveau 
de vie et selon le type socio-économique. 


Profils en colonne 


Niveau de vie one 
(en F/uc/mois)| Inférieur du 1er décile du 3° quartile écal . 
au 1* décile | au 3° quartile au % décile rare Ensemble 
<3700 |13700:9933[ [[9933;13900[| : 13 900 
Type socio-économique _ 
Communes agricoles 22 13 7 5 12 
Communes 41 41 31 22 37 
et quartiers ouvriers 
Communes et quartiers des 28 34 39 32 34 
classes moyennes tertiaires 
Communes et quartiers 3 5 11 13 7 
techniques très qualifiés 
Quartiers huppés 6 6 12 28 9 
Ensemble 100 100 100 100 100 
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Profils en ligne 


Niveau de vie Pat 
(en F/uc/mois)| Inférieur du 1° décile du 3° quartile al | 
au 1* décile | au 3° quartile au % décile _ a. de Ensemble 
<3 700 [3700 ; 99331 |19 933 ; 13 900[! | 13 900 
Type socio-économique L 
Communes agricoles 18 70 8 4 100 
Communes et quartiers 11 71 12 6 100 
ouvriers 
Communes et quartiers des 8 65 17 9 100 
classes moyennes tertiaires 
Communes et quartiers 5 sil 25 19 100 
techniques très qualifiés 
Quartiers huppés 6 44 20 30 100 
Ensemble 10 65 15 10 100 


3. Quartiers « huppés » : Me = 9 933 F/uc/mois 


4. On peut proposer comme indicateur de disparité : Do/D, = 3,76 
Nombre sans dimension qui indique que le9 © décile est 3,76 fois plus élevé que le 


1° décile. 


5. ((1 +12) - 0,15 + (13 +28) - 0,10)/0,25 = 30,2 % 


0,05 - 0,07n + 0,06 : 0,097 


0,0556 = 5,56 % 


0,16n 
0,51 - 0,07n + 0,44 - 0,09n _ 47,06 % 
0,16n 
0,25 : 0,07n +0,20 : 0,097 _ 55 19 % 
0,16n 
0,19 - 0,07n + 0,30 - 0,097 _ 25,19 % 
0,16n 
Niveau de vie : ; 
Re <3700 |1[3 700 ;9933[ |[9 933 ; 13 900[| 2 13 900 Total 
Fréquence (%) 5,56 47,06 22,19 25,19 100 
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Exercice 3.7 


1. 
ni. 
_— — 2 
X Ni y; D =) 

J= 
[5:71 12 7,17 27,67 
[7 ;9[ 28 9 60 
[9:11[ 39 10 120 
[11 ;13[ 54 11,37 206,6 
[13 ; 15[ 41 12,58 161,95 
[15 ; 17 22 14,36 69,1 
[17 ; 19] 4 16,5 11 

= Pÿ 2 
Y Ne #) 5 (Xi x;) 

i= 
[5571 10 6,8 17,6 
[7 ; 9[ 32 9,3 108,9 
[9; 11 59 10,8 312,95 
[11 ; 13[ 46 12,26 156,87 
[13 ; 15[ 36 13,9 127,55 
[15 ; 17[ 14 15,14 29,7 
[17 ; 19] 3 17,33 2,67 


2. La courbe de régression de Y en x est une ligne brisée qui joint les points ( x; , x 


étant le centre de la 5° classe de X. 


Courbe de régression de Y en x 
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ÿ =112 
SCynra = 656,32 


SCinter — 782,6 
SC = 1438,92 


782,6 


2 = 7826 _ 5 5843 
Mer 1438.92 
(6 
Sc. = 756.24 


intra 
SCnter = 921,24 
SCsn = 1677,48 


; _ 921,24 


= = (0,549 
XY 1 677,48 


i 


3. Les variables X et Y étant quantitatives, on peut mesurer leur liaison à l’aide du coef- 
ficient de corrélation linéaire : r2 = 0,542 = (0,736)2 
: 2 in(n2..… : n2 2 :n2 
On retrouve : 0 < 72 < min(n$,, : 4,7) < max, ; Nyy) < 1 


Exercice 3.8 


1. 


Eau minérale 


* 


E 


Arcens 

Arvie 

Badoit 
Beckerich 
Châteauneuf 
Eau de Perrier 
Faustine 

La Salvetat 
Perrier 

Puits St-Georges 
Pyrénées 
Quézac 

San Pellegrino 
St-Diéry 
St-Jean 
St-Pierre 
St-Yorre 
Vernet 
Vernière 
Vichy-Célestins 
Wattwiller 


DO mm DO DDR ne OO en en em À M © = ND mm ND 


= R D D PB © ND VU) me N mm LU = mi NO = PR mm NO J Uo 


2. Distribution conjointe 


yC 
1 4 
XC 
1 6 1 10 
2 1 0 6 
3 0 3 9 
Total 7 4 21 
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Tableau des profils en ligne 


yC 
1 2 3 4 
XC 

1 60 10 20 10 100 

5 16,7 50 155 0 100 

3 0 40 0 60 100 
Fan 333 28,6 19,1 19 100 
moyen 


3. Les profils en ligne n’étant pas identiques, les deux variables ne sont pas indépen- 
dantes. 


4. Distribution conditionnelle de XC sachant { Y > 300 mg/l} : 


Exercice 3.9 
1. Taux trimestriel moyen : (1 + c)!! = 339/117 = 2,90 = (1,10)! = c = 10 


2. 


2.1. 
2.2. 


à = 16,52 
r = 0,90 


— Part de variation de Y non expliquée par le modèle = 1 


XC Effectif 
Clx 3 
C2x% 2 
C3x% 3 


b = 98,50 


rn=1l 


0,81 = 19% 


Nombre de contrats souscrits 


100 
121 
144 


117 
178 
149 
189 
145 
173 
170 
223 
223 
281 
285 
339 
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A 


3.1. 4=1,3  b=135,45 


3.2. r=0,94 
= Part de variation de Y non expliquée par le modèle = 1 — 72 = 1 — 0,88 = 12 % 


Le modèle quadratique est préférable au modèle linéaire puisque le coefficient de cor- 
rélation linéaire est plus élevé pour ce modèle. On peut aussi dire que la part de varia- 
tion de Y non expliquée est plus faible avec ce modèle. 


Chapitre 4 


Exercice 4.1 


let 2. 
C3 v fe =(52+53+54)3 
A B RE D | EE | _F | © | 

| 1 | Mois | Nombre de jours | 1136) 

2) 1 22 
|. RE 29 CZ 1 
En] 3 35 30,67 
[ES] 4 28 39,00 
BEBI 5 54 49,00 
LE | 65 359,33 
[8] 7 59 69,00 
1 |: 83 35,67 
[10] 9 25 46,33 
[11] 10 31 21,33 
TER 8 16,00 
13] 12 9 


La moyenne mobile lisse la série chronologique, et permet d’évaluer la tendance. 


Exercice 4.2 


1 


a] 
ssl 
4 


fe =10-2*A5+E5 


CLAIR € D OL EL 6 JS 
(M] < x Mat) Mat) Mac) dE) Matt) 
L2/ 1 3 

EN 3 | à 1,5 233 

413 5 25 1,67 2 22 6 
En _: 1 2,5 3,00 2 18, C4] 
16] 5 3 1,5 1,00 2 26 2 
EM 6 | à 1,5 233 2 1,8 0 
[8 | 7 5 25 1,67 2 22 2 
[9] 8 1 25 3,00 2 1,4 4 
10! 9 3 1,5 1,00 2 26 6 
[11] 10 | + 1,5 233 2 18 8 
A2] n | 5 25 1,67 
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La série x, est périodique de période 4. 

Toutes les suites de moyennes mobiles sont aussi périodiques de période 4. 

La suite des moyennes mobiles de longueur 4 est constituée de termes constants égaux 
à la moyenne des termes sur une période. 


2. La moyenne mobile tranforme une série alignée en elle-même, donc la série 
y, = 10 — 2f est transformée en elle-même, et la suite des moyennes mobiles de lon- 
gueur 4 de la série z, est égale à : 10—-2r#+2=12-2# (1-3 à 10). 


Exercice 4.3 


1. Le schéma additif est adapté puisque les lignes brisées qui joignent d’une part, les 
maxima (distants de 6 dates), et d’autre part, les minima (distants de 6 dates) sont à 
peu près parallèles. 


2. à 6. La période du mouvement saisonnier étant égale à 6, on évalue la tendance par la 
suite des moyennes mobiles de longueur 6. 


t x [MOD Ix;-M | 5, s', | CVS | Tendance | Prévision dé 
11133 —1,1| 14,4 14,0 
2 | 15,1 —0,2| 15,3 14,1 
3 | 148 —0,1| 14,9 14,3 
4 | 16,3 | 148 1,6 2,0! 2,0| 14,3 14,5 
5 | 148 | 14,7 0,0 0,0! 0,1! 14,7 14,6 
6 | 14,2 | 14,6 —0,5 |-0,81-0,7| 14,9 14,8 
7 | 13,8 | 14,6 —0,8 |—-1,2|-1,1| 14,9 14,9 
8 | 14,2 | 14,7 -0,5 |—-0,2/-0,2| 14,4 15,1 
9 | 14,1 | 148 —0,7 |-0,2/-0,1| 14,2 15,3 
10 | 17,0 | 14,9 2,1 2,0! 2,0 14,9 15,4 
11 | 15,2 | 15,1 0,1 0,0! 0,1! 15,2 15,6 
12 | 14,8 | 15,4 —0,6 |-0,81-0,7] 15,5 15,7 
13 | 14,4 | 15,7 —1,3 |-1,21-1,1| 15,5 15,9 
14 | 16,0 | 15,9 0,1 |—-0,21-0,2| 16,1 16,1 
15 | 16,2 | 16,0 0,1 |-0,2|-0,1| 16,3 16,2 
16 | 18,5 | 16,2 2,3 2,0| 2,0! 164 16,4 
17 | 16,2 | 16,3 — 0,1 0,0! 0,1! 16,1 16,5 
18 | 15,3 | 16,5 —1,2 |-0,8/-0,7| 16,0 16,7 
19 | 15,4 | 16,7 —1,3 |-1,21-1,1| 16,5 16,9 
20 | 16,8 | 17,0 —0,2 |-0,21-0,2| 16,9 17,0 
21 | 17,4 | 17,3 0,1 |-0,2/-0,1! 17,5 17,2 
22 | 19,9 2,0| 17,9 17,3 
23 | 17,9 0,1! 17,8 17,5 
24 | 17,4 —0,7| 18,1 17,7 
25 | 17,2 — 1,1 17,8 16,7 0,5 
26 | 18,5 — 0,2 18,0 17,8 0,7 
27 | 18,6 — 0,1 18,1 18,0 0,6 
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227 


Prévision 
20: 


181 Droite des moindres carrés 


167 


14- M, (t) 


12 T T T T 
Jv-Fv 2002 Jv-Fv 2003 Jv-Fv 2004 Jv-Fv 2005 Jv-Fv 2006 


Coefficients de la droite des moindres carrés ajustant la série CVS: 

â=0,16  b = 13,82 

= ÿ, = 0,16: 1+ 13,82 

D Êss = frs L1=167 À, = $36-0,2=-17,8 À, = ÿ,7-0,1 = 18 


— Les erreurs de prévision étant toujours positives, l’erreur absolue moyenne est 
égale à l’erreur moyenne de prévision : = (0,5 + 0,7 + 0,6)/3 = 0,6 


Pour tracer avec Excel la droite des moindres carrés qui ajuste la série CVS : onglet 
« Graphique », « Ajouter une courbe de tendance », type « Linéaire ». On peut utiliser 
ensuite l’onglet « Options » pour « Afficher l'équation sur le graphique » et pour 
« Afficher le coefficient de détermination (R 2) sur le graphique ». 
Exercice 4.4 


1. Sur la représentation graphique, on remarque une composante saisonnière de période 4. 


2. à 6. 


12 v fe =21,6*A2+3270 8 


datt)  x1/ Matt) fendance | Prévision 
1,062 3228,7 3292,4 
0,979 3365,8 33140 


33416 1,010 1,006 3355,1 1,004 | 0004 33356 
33646 0,950 0,953 3353,5 0,997 | -0,003 | 33572 
33768 1,058 1,062 3365,3 0,997 | -0003 | 33788 
3397,1 0,981 0,979 3405,7 1,003 | 0003 | 34004 
3426,5 1,002 1,006 3412,7 0,996 | -0,004 | 34220 
3452,4 0,956 0,953 3463,7 1,003 | 0003 34436 
3475,9 1,065 1,062 3487, 1,003 | 0003 : 34652 
3493,1 0,976 0,979 34843 0,997 | -0003 | 34868 

1,006 3523,0 3508,4 


= 6/w0loœo mlo lu )pltw nimes | 


12 | 3377 0,953 3492,1 3530,0 
13 35516 3771 
14 3573,2 3498 
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Calcul des coefficients de la droite des moindres carrés avec Excel © : 
à = Index(Droitereg(F2:F13;A2:A13);1) = 21,6 


b = Index(Droitereg(F2:F13;A2:A13);2) = 3 270,8 
> ÿ, =21,6: 1+3 270,8 
= 


À,3 =(21,6-13+3 271)-1,062=3 771 


À,4 = (21,6: 14+3 271) -0,979 =3 499 


3 900 - 

3 800 - 

3700 - 

+ X} 

3600 = Mat 

3 500 - —a— CVS 
3400 tendance 
800 | —x— Prévision 
3200 : 


3100 L T T T T T T T T T T T 1 
12 3 4 5 6 7 8 9 10 11 12 13 14 
Semaine 


Exercice 4.5 


C8 2 fe =0,3"B7+0,7*C7 


Demande 


l 


Prévision 


NON ASS SORTE GP IONMIMIESIDERSISSIPSIARLE 
Mois 
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Jusqu'au 6° mois inclus : À 
À partir du 7° mois : À 


2. 


= 0,6-x,+0,4-, ; 


{ 
= 0,3-x,+0,7-À,_; 


t 


Une constante de lissage élevée jusqu’au 6 © mois inclus permet un taux de réponse 
plus rapide au changement de niveau du début de la chronique. 


Erreur moyenne = 0,56 
Erreur absolue moyenne = 1,48 


Erreur quadratique moyenne = 3,09 


Sous l’hypothèse d’une série sans tendance, la demande est supposée constante. Les 
prévisions de la demande pour les mois 16, 17 et 18 sont égales à 41,4 unités. 


Exercice 4.6 


L 


Cette chronique a une composante saisonnière de période 4 et une tendance approxi- 
mativement constante sur la période 2002-2005. Les deux schémas de composition 
peuvent être envisagés. Nous choisissons le schéma additif. 


Pour une chronique avec une composante saisonnière de période 4, la moyenne 
mobile de longueur 4 élimine la saisonnalité et permet d’évaluer la tendance. 


140 - 


80 T T T T T T T T T T T T T T | 
1 trimestre 2003 1% trimestre 2005 
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t x, M4 |x- M4 S; CVS  |LES (a=0,3)|Prévision| Erreur 
1 94,2 | 108,12 | —4,65 | -12,04 | 106,3 
2 | 105,3 | 108,44 19,03 | —3,26 | 108,5 106,3 
3 | 103,5 | 109,78 | —11,48 | —1,26 | 104,7 107,0 
4 | 127,5 | 111,06 | —7,30 | 16,57 | 110,9 106,3 
. 98,3 | 111,14 4,56 | — 12,04 | 110,3 107,7 
6 | 103,8 | 112,34 13,16 | —3,26 | 107,0 108,5 
7 | 115,7 | 112,07 | —11,17 | —1,26 | 117,0 108,0 
8 | 125,5 | 111,03 | —0,30 | 16,57 | 108,9 110,7 
9 | 100,9 | 110,30 | —3,70 | -12,04 | 112,9 110,2 
10 | 110,7 | 108,78 17,52 | —3,26 | 114,0 111,0 
11 | 106,6 | 107,71 | —-13,48 | —1,26 | 107,9 111,9 
12 | 126,3 | 107,46 | —2,20 | 16,57 | 109,7 110,7 
13 98,7 — 12,04 | 110,8 110,4 
14 | 109,8 — 3,26 | 113,0 110,5 
15 | 110,8 — 1,26 | 112,1 111,3 
16 | 129,4 16,57 | 112,8 111,5 
17 | 100,8 111,5 99,9 0,9 
18 | 110,8 111,5 108,6 2,2 


La série CVS pouvant être considérée sans tendance, on peut utiliser le lissage expo- 


nentiel simple. 


Après avoir resaisonnalisé les prévisions obtenues avec le LES, on obtient les prévi- 
sions de l’indice trimestriel pour les deux premiers trimestres 2006 qu’on peut com- 


parer aux observations. 


On obtient : 
Erreur moyenne de prévision = Erreur absolue moyenne de prévision = 1,55 


140- 


80 
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Prévision 


10 11 


12 13 14 


15 16 17 18 


Chapitre 5 


Exercice 5.1 


a) 75/120 = 0,625 
b) 50/120 = 0,417 
c) 45/120 = 0,375 
d) 100/120 = 0,833 


Exercice 5.2 


A = « Être allé en Espagne» _B = « Avoir pris l'avion » 
P(A) = 0,6 
P(B) = 0,45 
P(ANB)=0,25 
P(ANB) P(ASB) 1-PÆALB) 
= 1 - (P(A) + P(B)- P(ANB))=0,2 


Exercice 5.3 


1. A=« Lire Notre Campus»  B=« Lire la Vie Étudiante » 
P(A) = 23 522/32 564 = 0,722 
P(B) = 18 859/32 564 = 0,579 


P(ANB)= 11 422/32 564 = 0,351 
a)P(ANB) P(ASB) 1-BRAUB) 1-(P(A)+ P(B)- P(ANB)) = 0,05 
b)P(ANE) P(A)= P(ANB))= 0,371 


2. a) 0,052 = 0,0025 
b) 0,351 - 0,05 = 0,018 


Exercice 5.4 


n = 2 : 4 événements élémentaires { P,P}, {P,F},{F,P},{F,F} 

P(A)=3/4 P(B)= 1/2 P(ANB)=1/2 z P(A) : P(B) 

=  Aet B non indépendants 

n =3 : 8 événements élémentaires 

{P,P,P}, {P,P,F}, {P,F,P}, {P,F,F}, {F,P,P}, {FE P,F}, {F,F,P}, {FFF} 
P(A)=1/2 P(B)=3/4 P(ANB)=3/8 = P(A) : P(B) 

=  AetB indépendants 

et si on continue... on peut montrer que À et B ne sont indépendants que pour n = 3 


Exercice 5.5 


1. Il ya 25 familles différentes de 5 enfants et () familles de 5 enfants avec 3 filles et 


2 garçons. Par hypothèse toutes les familles sont équiprobables : 
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P(trois filles et deux garçons) = 


nombre de cas possibles 57 3 


5 
nombre de cas favorables () 


10 
— =0,3125 
2 


2. Toutes les familles ne sont plus équiprobables. On a une probabilité égale à 
(0,48) + (0,52)2 d’avoir une famille de 5 enfants avec 3 filles et 2 garçons, et toutes 
les familles étant incompatibles, on a : 


=  P(trois filles et deux garçons) = () (0,48)3 - (0,52)2 = 0,299 


Exercice 5.6 


1. E(X) = 5/3 = 1,667 


=  E(TIK(X)) = 600 : E(X) - 


800 = 200 € 


Gx = 0,943 (utiliser les fonctions statistiques d’une calculatrice) 
Onx) = 600 - 6x = 565,68 € 


Signification de l’espérance du profit : sur un très grand nombre de jours, la moyenne 


du profit sera voisine de 200 €. 
2. Loi de probabilité du profit : 
valeur de X 0 1 2 9 
valeur de IT — 800 — 200 400 1 000 
Probabilité 1/6 1/6 1/2 1/6 


Fonction de répartition du profit : fonction en escalier, continue à droite, les points de 
discontinuité correspondant aux valeurs possibles du profit. 


Z <-—800 [-800,-200[  [- 200, 400[ [400, 1 O00[ 2 1 000 
Fr) = PA < 2) 0 1/6 2/6 5/6 il 
——————— 
E—— 
——————— 
————— T T T T T T T T T 1 7 
1 000 — 800 — 600 —400 —200 0 200 400 600 800 1000 1200 1 400 


Exercice 5.7 


1. E(B)=0:0,6+ 500 -0,25 +1 500 - 0,1 +2 500 : 0,05 = 400 € 


= 
doit être fixé à 450 € 


Pour espérer un bénéfice moyen de 50 € par assuré, le montant de la cotisation 
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2. Le montant encaissé de la part de deux assurés est égal à 900 €. 


= Il faut qu’au plus un seul des deux assurés ait un sinistre, et le règlement de ce 


sinistre ne peut pas dépasser 500 € 
— La probabilité demandée est égale à : 0,62 + 2 - 0,6 - 0,25 = 0,66 


Exercice 5.8 


1. EN) =1,1  var(X) = 0,69 


12 
2 Y = > X; — valeurs possibles de Y : {0, 1,2, ..., 24} 
= 1 
12 
E(Y) = D E(X;) =12:1,1 = 13,2 
i=1 
12 
var(Y) = Y var(X;) = 12: 0,69 = 8,28 
1 


(utiliser les fonctions statistiques d’une calculatrice) 


car les v.a. X; sont indépendantes 


12 12 
BCE = 0) = P( nixs= 01) = [] PX,=0) = 03/2 = 5,3. 107 
il i=1 
car les X; sont indépendantes 
3.1. 
Z 
x 0 1 2 3 + 
0 1 0 0 0 0 
1 0,1 0,6 0,3 0 0 
0,12 2-0,6-0,1 2-0,3-0,1+0,62 | 2-0,6-0,3 0,32 
O1 0,12 042 0.36 0,09 
3.2. 


=1-0,3+ 0,1 - 0,3 + 0,01 : 0,4 = 0,334 
P(Z= 1) = 0,6 : 0,3 + 0,12 - 0,4 = 0,228 
P(Z=2)=0,3 : 0,3 + 0,42 : 0,4= 0,258 
P(Z= 3) = 0,36 : 0,4 = 0,144 
P(Z= 4) = 0,09 : 0,4 = 0,036 
E(Z)=1,32  var(Z) = 1,39 


(Gtilisation d’une calculatrice) 


Exercice 5.9 


Appelons D l’événement : 
{une pellicule tirée au hasard dans la production est défectueuse} 
PO) = P({D et machine A} L {D et machine B} L {D et machine C}) 
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PZ=0)=P({(Z=0)Nn(X=0)} U{(Z=0)Nn(X=1)} U{Z=0) Nn (X=2)}) 


Les 3 événements étant incompatibles : 


PO) = PDNA) +P(D NB) + PDA C) = 0,2 : 0,06 + 0,5 - 0,05 + 0,3 - 0,03 = 0,046 
P(A|D) P(B|A) P(A)/P(D) = 0,261 


P(AID) P(B|A) P(4)/P(D) = 0,94 - 0,2/0,954 = 0,197 


Exercice 5.10 


1. 
x F u 0 1 Loi de Y 
0 1/4 a 1/8 15/40 + a 
1 1/5 b 1/10 12/40 + b 
Loi de X 13/40 a+b 9/40 27/40 + a + b 
— aths D B-(B+a)=2 — a: Br — rer 
40 40 \40 4 18 40 72 90 
2. 
X 0 1 
15 40 _5 12 40 _ 4 
= + = — = - = +h = — = - 
F | 4° à 407700 9 
Puisque X et Y sont indépendantes, les lois conditionnelles de X pour les différentes 
valeurs de Y sont identiques à la loi marginale de X. 
3. 
x . u 0 1 Loi de Y 
1/4 1/5 1/8 23/40 
1 1/5 1/8 1/10 17/40 
Loi de X 18/40 13/40 9/40 Il 
17 18 9 u Il 
E = — E = — + — EX - = = + — 
La de CT 


Si p = 0, alors cov(X, Y) =0: 
1 17 [18 9 
EX-N=! + -EX.E =7.(S. +) 
Re on Te TT 
_ 17-18 


= 2u u = 17:9 _ = u=-0,5 
160 160 
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Exercice 5.11 


1. 
Y . 
x 0 1 Loi de X 
0 P 12 -p 1/2 
1 1/3 -p 1/6 +p 1/2 
Loi de Y 1/3 2/3 1 


Toutes les probabilités devant être comprises entre 0 et 1, on doit avoir 
O<p<l 
PEU2 = O<p<13 
p < 1/3 
p < 5/6 


2 ED=12 EM=43 EX-Y=2:(p+1/6) 
= cov(X, Y)=2:(p + 1/6) -2/3 =2p — 1/3 


EX) =1/2 E()=8/3 —  var(X)=1/4  var(») = 8/9 
2p-1/3 _ 6p-1 


— X, Y) = 
px, ) er 
3 


2 


Chapitre 6 


Exercice 6.1 


1. Au ic individu (i = 1 à 10), on associe une variable de Bernoulli : 
1 sii individu gaucher p=0,1 
X; = 
O sinon g=0,9 
Soit Y, le nombre de gauchers parmi les 10 individus : 
Y est une somme de 10 v.a. indépendantes de Bernoulli de même paramètre p=0,1 
10 
> Y= SX; > %(10;0,1) 
i= 1 
On utilise les tables de la loi Binomiale pour calculer les probabilités 
PXY2>1)=1-P(Y=0)=1-0,3486=0,6514 P(Y<3)=0,9872 


2. Pour que chacun des 10 membres du personnel trouve une paire de ciseaux à sa con- 
venance, il faut que le nombre de gauchers soit au plus égal à 3 et au moins égal à 1 : 
PA<SY<3)=PY<3)-P(Y<1)=P(Y<3)-P(Y=0)=0,9872 — 0,3486 = 0,6386 
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Z 9 10 10 10 9 8 7 6 5 + 3 


En utilisant la table d’une loi binomiale de paramètres 10 et 0,1, on déduit la loi deZ: 


Z ce 8 9 10 


P 0,0001 0,0015 0,3599 0,6385 


Les probabilités associées aux valeurs 3, 4, 5 et 6 sont négligeables. 


Exercice 6.2 


1. Au si assuré (i = 1 à 10 000), on associe une variable de Bernoulli : 
1 si it assuré a un accident de ce type  p = 1/5 000 
X. — 


L 
O sinon g=1l-p 
Soit Y, le nombre d’accidents par an parmi les 10 000 assurés. 
On suppose les X; indépendantes, Y est alors une somme de 10 000 v.a. indépendantes 
de Bernoulli de même paramètre p = 1/5 000 : 
10 000 


F= D X; — (10 000 ; 1/5 000) > P(2) 
i=1 n>50 et p<0,1 


=  P(Y<3)=0,8571 (lecture de table) 


Exercice 6.3 


1. À la ième machine (i= 1,2), on associe : 
> 1 si ie machine disponible  p =0,9 
i _ 
O0 sinon 


Le nombre Y de machines disponibles un jour quelconque est une somme de 2 v.a. 
indépendantes de Bernoulli de même paramètre p=0,9 = Y — (2 ; 0,9) 


Valeurs de Y 0 1 2 
Probabilité 0,01 0,18 0,81 
2.1. 
Z 

Y 0 1 2 3 

Valeurs de N 0 0 0 0 
1 0 1 1 1 

0 1 2 
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2.2. 


Valeurs de N 0 1 2 


Probabilité 0,109 0,324 0,567 


P(N=2) =P{Y=2NZ=2}U{Y=2NZ=3}) 

= P{Y=2nNnZ=2})+P({Y=2nZ=3) 

= P(Y=2)-(P(Z=2)+ P(Z = 3)) = 0,81 : 0,7 = 0,567 
P{N= 1) = 0,18 - (0,2 + 0,4 + 0,3) + 0,81 : 0,2 = 0,324 
P{N=0)= 1— 0,324 — 0,567 = 0, 109 
E(N) =1,458 — Marge brute moyenne = 29,16€ 


3. Y désigne maintenant le nombre de machines tombant en panne au cours de la l'° année. 


$ 1 si i machine en panne au cours de la 1 année  p = 0,05 
i = 

O0 sinon 
(G=1,...,60) 


Hypothèse : les 60 v.a. de Bernoulli sont indépendantes 
— Yest une somme de 60 v.a. indépendantes de Bernoulli de même paramètre p = 0,05 
60 


Y= SX; — %(60 ; 0,05) > P(3) 
et n>50 et p<0,1 


1) On a en moyenne 3 pannes puisque ÆE(Y) = 3. En cas de machines non garanties, le 
coût moyen est donc égal à : 3 - 200 = 600 €. 


Le discount étant de 1 200 €, on choisit le discount. 

ii) La remise est inférieure au coût de réparation si plus de 6 machines tombent en 
panne : 

PY>6)=1-P(Y< 6)=1-0,9665 = 0,0335 > 1 % 

— on choisit la garantie pour chaque machine. 


Exercice 6.4 


1. À chaque essai, on peut associer une v.a. de Bernoulli de paramètre 0,95. Le nombre 
d’essais Y nécessaires pour se connecter 5 fois suit une loi de Pascal de paramètres 
K=5 et p = 0,95. Appliquons les résultats du cours : 


EM=£ = 5 -526 va("= EU ep) 027% 


p 0,95 p 


2. Pour avoir { Y = 5}, il faut s’être connecté les 5 fois avec succès : 
P(Y=5)= (0,95) = 0,774 
La v.a. Y peut prendre toutes les valeurs entières au moins égales à 5 : 
PY>6)=1-P(Y=5)-P(Y=6)=1-0,774-5 (0,95) 5 - 0,05 = 0,0325 


Exercice 6.5 


1. Lorsque X, = x, le nombre de demandes satisfaites Y, peut prendre toutes les valeurs 
entières de 0 à x, et chaque demande est satisfaite avec une probabilité (1 — x). 
MX x} = B(x; 1-7) 
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2. P(Y,==P(Y,=HN(X2k)= S P(Y,=kX,=x): PX,= x) 


x>k 
= y () (1 nÿ Tr” 5 Has _—— - (1-7) un. qu” 
SR k x! LS)! x! 
k ju k 
DU ER a ls. ,1# 
si DATE ( L ) ER à ( 7 LE Lu: 


Il 


—U k X k 
eh firm to Gm _ H(G-mu) per 


È CES 
k! 
> -P(-T:p 


3. u=10 et n=02 — Y,—>P(8) —  P(Y,<8)=0,4530 
PG< Y,<10)= P(Y,< 10) P(Y, < 3) = 0,8159 — 0,0424 = 0,7735 


Exercice 6.6 


1. À la & minute (i= 1 à 30), on associe : 
1 si vente © minute p=0,01 
Le — 


Lt 
O sinon  g=0,99 
Soit Y, le nombre d'unités vendues en 30 min. 
— Yest une somme de 30 v.a. indépendantes de Bernoulli de même paramètrep = 0,01 
30 
> Y= YX; =%(30;:0,01) = PY23)=1-P(Y<2)=1-0,9967 = 0,0033 


= 


2. Le magasin est ouvert 7 h 30 par jour, donc 450 min par jour. 
450 
Z = nombre d’unités vendues par jour = Y X; — %(450 ;,0,01) —  E(2)=4,5 
i=1] 


Z = R(450 ; 0,01) > P(4,5) 
n>50 et p<0,1 


3 P(Z>8)=1- P(Z<8)= 1 —-0,9597 = 0,0403 
Exercice 6.7 


1 X—#(5) P(X<2)=0,1247 
PUX<2} 0 {X2 6})=0,1247 + 1 —-0,6160 = 0,5087 
P(X<6[X 22) = PO£X<6) _ P(X£<6)-P(X<2) _ 0,7622 —0,0404 _ 0,7522 
P(X>2) 1-P(X<2) 1 — 0,0404 
2. Y=X, + X, — P(10), car Y est somme de deux v.a. de Poisson indépendantes 
P(Y = 10) = 0,5831 — 0,4580 = 0,1251 
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3. P(X23)= P{X>23NX=6}U{IX>3NA=8}=P{X>3NÀ=6}+ P{X>23NAÀ=8}) 
=P({X23|1=6}-PA=6)+P(X23|À=8)-P(X= 8) = 0,938 - 2/3 + 0,9862 / 3 0,954 


Exercice 6.8 


1. X.= ! si i autobus en panne  p = 0,0025 
0 sinon  g = 0,9975 
= Y est somme de 1 000 v.a. de Bernoulli de même paramètre p = 0,0025 qu’on sup- 
pose indépendantes. 


1 000 
5 Y= D x = (1000 ; 0,0025) — E(Y=2,5 var(Y) = 2,5 


i=1 


1 000 
2 —Yy= D x = (1 000 ; 0,0025) > P (2,5) 
i=i 
n>50 p<0.1 
P(3<Y<7)=P(Y<6)-P(Y<3)=0,9858 -0,7576 = 0,2282 
3. P(Y<8)=0,9989 — La capacité du service de maintenance doit au moins 
égale à 8 autobus pour que la probabilité que toutes les pannes soient traitées dans la 
journée, soit au moins égale à 0,998. 


4 P(Y>6)=1-P(Y<6)=1-0,9858 =0,0142 


365 
5. Z = D x; — B (365 ; 0,0142) > P (5,183) 
1=1 
n>50 p<0.1 
P(Z=0)=e-518 = 0,0056 


Exercice 6.9 


LS X+90) 
X, et X, indépendantes = Y =X, +X, — P (5) 


2. P(Y=8)=0,0653 


P({X,=5S}Nn{x =3}) 


3. P(X,=5/Y=8)= 


P(Y=8) 
- PUXI=5}TX2=3}) _ 01008 -0,1804 _ 52785 
P (Y=8) 0,0653 ? 


Exercice 6.10 
1. x = 0,61 Var (X) = 0,6079 
2. Variable discrète : 


— les valeurs possibles sont les nombres entiers positifs ou nuls ; 
— la moyenne est peu différente de la variance. 
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On a une variable discrète à valeurs positives ou nulles avec une moyenne quasi-égale 
à la variance. On peut envisager une loi de Poisson  ® (0,61). La comparaison des 
diagrammes en bâtons des distributions observée et théorique montre une excellente 
adéquation. 


Nombre de décès x} 0 1 2 3 4 5 u dotal 
Cumul des années n} 109 65 22 3 1 0 200 
Probabilité P (0,61) | 0,5434 | 0,3314 | 0,1011 | 0,0206 | 0,0031 | 0,0004 1 
Nombre théorique n*} 108,7 66,3 20,2 4,1 0,6 0,1 200 


120 


100 + Observé 


Théorique 


L L 
nm | — 


Chapitre 7 


Exercice 7.1 


L 


X = N(45 ; 4) 
P(X < 39) = Fy((39 — 45)/4) = Fy(- 1,5) = 1— Fy(1,5) = 1 —0,9332 = 0,0668 
P(X > 48)=1-— P(X <48)= 1- Fy(0,75) = 1 —0,7734 = 0,2266 

P(39 < X <48)= P(X < 48)— P(X < 39) = 0,7734 — 0,0668 = 0,7066 


P(IX- mm) <o)= P(m-6<X<m+06)= F1) - Fyt- 1) =2F,(1) — 1 = 0,6826 
(en fait, résultat de cours : $ IL.C) 


Puisque m=45 eto =4,ona : {41 <X<49} & {m-G<X<m+6} 
PA4I£<X<49]X239)= P({41<X< 49} N{X 2 39})/P(X > 39) 

= P(41 < X< 49/P(X > 39) 

= 0,6826 / 0,9332 = 0,7315 
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Exercice 7.2 


1. P(X<2 400) = F,((2 400 — m)/6) = 0,0228 — (2400 - m)/o = -2 
P(X > 3 000) = 0,0446 —  P(X<£<3000)=0,9554 — (3000 - mo = 1,7 
On résout un système de 2 équations à 2 inconnues : m=z2724€ 6=<162€ 
=  X—N(2724 ; 162) 


2. Soit X; le gain du 5 mois, par hypothèse, les X; sont äid à X (iid pour « indépendants 
et identiquement distribués »). 
La v.a. Y égale au gain pendant trois mois est une somme de 3 v.a. normales indépen- 
dantes et par conséquent, suit une loi normale : 


3 
Y= SX; — N(3m; o \/3), soit : N(8 172 ; 280,6) 
i=1 


3. P(Y >8 700) = 1 - Fy,(528/280,6) = 1 — Fy(1,88) = 1 — 0,9699 = 0,301 


Exercice 7.3 
1 p=P(X>2,5)=1-P(X<2,5)=1- Fy(1,67) = 1 —-0,9525 = 0,0475 = 0,05 
2. Àlai imprimante tirée, on associe une v.a. de Bernoulli X; de paramètre 0,05 : 


1 si durée de vie > 2,5 millions de pages 
X: — 


L 
O0 sinon 


—  Y'est une somme de 60 v.a. indépendantes de Bernoulli de même paramètre p 
(les X; sont considérées indépendantes puisque les imprimantes ont été tirées au 
hasard dans une production supposée suffisamment importante pour avoir un taux de 
sondage n/N inférieur à 10 %) 


60 


>  Y= Y X; = (60; 0,05) > P(3) 
i=] n > 50, p <0,1 


3. En utilisant les tables de la loi de Poisson, on obtient : 
P(Y = 6) = 0,9665 — 0,9161 = 0,0504 
P(Y>3)=1- P(Y<2)=1-0,4232 = 0,5768 


Exercice 7.4 


1 POS£<X< 125) = Fy (1) — Fy (— 1) = 0,6826 
en fait : P(75 £<X< 125) = P(IX - m) < 6) 
P(X > 150) = 1 — F7; (2) = 1 —-0,9772 = 0,0228 
en fait : P(X > 150) = P(X > 26) 


n, — 100 ni — 100 

2. P(X>n,)=09 = Fo( 5 ) =01 = 55 =-12816 — n,= 68 
n, — 100 n; — 100 

PX<n;)=04 = Fu( ) =0,4 = 53 =-0,2533 = n,=94 
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3. On cherche a tel que : P(IX — m| < a) = 0,9 


_ p{lnl <) = 0,9 _ 2F4(£)-1 = 09 
(o) ô ô 


+, E; (2) = 0,95 — %=1,645 — a=41,125 
(eo) [eo] 
> [m-a;m+a]=1[58,87 ; 141,13] 


Exercice 7.5 


1. Soit X; la variable aléatoire de Bernoulli associée lait bouteille « grand cru » achetée : 


. 1 si i bouteille « vin courant» p = 0,12 
i = 

0 qg=0,88 i=1,...,200 
Le nombre Y de bouteilles de vin courant parmi les 200 bouteilles achetées est égal à 


200 
la somme des 200 variables de Bernoulli X;:Y= Y X; 
i=l 
Les 200 bouteilles étant supposées tirées au hasard dans l’ensemble des bouteilles 
« grand cru » avec un taux de sondage inférieur à 10%, la v.a. Y suit une loi binomiale 
B(200 ; 0,12). 
E(Y) = np =24  var(Y) = npq = 21,12 


Puisque npq = 21,12 > 18, la loi de Y peut être approchée par la loi normale.N (24 ; 4,6). 
2. Comme on approxime une loi discrète par la loi normale, on fait la correction de 


continuité : 
P(Y > 20) = 1- P(Y<20)=1 — F,{(20 + 0,5 —24)/4,6} = 1 — F,(— 0,76) = 0,7764 


PY<301Y> 20) PUO<Y<30) _ P(Y<30)-P(Y <20) 


P(Y > 20) 0,7764 
F,(12)-F,(-076 L 
P(Y<30| Y>20) = tn = nn = 0,8517 


3. Les bouteilles de type courant, en nombre Y, occasionnent une perte unitaire de 1,5 €. 
Les bouteilles réellement « grand cru », en nombre (200 — Y), créent un bénéfice uni- 
taire de 2,50 € (= 6 — 3,5). Donc, au total : 

Bénéfice = 2,5 -(200-Y)-1,5Y=500-4Y —  P(Bénéfice > 0) = P(Y<125)=1 


Exercice 7.6 


1. Sachant que la probabilité d’une réunion de 2 événements incompatibles est égale à 

la somme des probabilités de ces événements, on a : 

P(A) = P({vrais jumeaux et 2 garçons} LU {faux jumeaux et 2 garçons}) 
= P(vrais jumeaux et 2 garçons) + P(faux jumeaux et 2 garçons) 

P(A) = P(2 G| vrais jumeaux) - P(vrais jumeaux) + P(2 G] faux jumeaux) - P(faux jumeaux) 
=V2+(1- X)/4=(À+1)4= P(B) 

P(C) = P({faux jumeaux} N {1 garçon et 1 fille}) 
= P( garçon et 1 fille | faux jumeaux). P(faux jumeaux) = (1 — À)/2 
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2. À la i* naissance, on associe : 
1 si i naissance avec 1 GetlF p=(1-A)2 
X. — 


O0 sinon 
—  Yest une somme de 1 000 v.a. indépendantes de Bernoulli de même paramètre p 
1 000 
= Y= Y X; — R(1000;(1-2X)/2) 
i=1 
E(Y) =500-(1-2X)  var(Y) = 250: (1 — 2) 


3. SiA=0,35: Y — (1 000 ; 0,325) > N(325 ; 14,8) 
npq >18 


300 — 325 
14,8 


P(G310 < Y < 350) = P(Y < 350) — P(Y < 310) 
= F(4,69) — F,(- 1,01) = 0,9545 — (1 — 0,8438) = 0,7983 
=  PGIO<Y< 350 Y > 300) = P({310 < Y 350} Nn {Y >300})/P(Y > 300) 
= 0,7983/0,9545 = 0,836 


P(Y > 300) = 1- P(Y< 300) = 1- Fu ( ) = Fy(1,69) = 0,9545 


Exercice 7.7 


1. Pour une variable statistique continue, on calcule une valeur approchée de la médiane 


par interpolation linéaire : Me € [35 ; 40 —= Me=35+5: 1086 = 36,75 


E? v fe =37+10*D2 


30 40 


Quantile théorique 
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La loi normale N(37 ; 10) est adaptée puisque le nuage des points (xŸ, x;) est approxi- 
mativement aligné le long de la première bissectrice. 


3.1. X, représente la durée moyenne des n interviews 


n 

SX; — N(n-m, GA/n) puisque les va. X; sont id à X 
i=1 
(iid pour « indépendantes et identiquement distribuées ») 


> XX, — s(37; 2) 


n 


3.2. P(X4 < 35) = Fy(- 0,26) = Fy(- 0,49) = 1 — 0,6879 = 0,3121 


3.3. P(X, <45)= Fy(8/n/10)20,99 —  0,84/n > 2,3263 
= n2>(2,3263/0.8) =846 = n>9 


Exercice 7.8 
1.1. Soit Y le nombre d’actions en hausse parmi les 10 actions 
1 si action en hausee p =0,7 
x: = 


O sinon g=0,3 
—  Yest somme de 10 v.a. de Bernoulli indépendantes de même paramètre p = 0,7 
10 
=. Y=— > X;,— B(10:,0,7) —= Z=10-Y — (10 ;0,3) 
i=1 
1.2. P(Y28)=P(Z<2)=0,3828 P(Y<4)= P(Z > 6)= 1 -0,9894 = 0,0106 
100 


Y X; — (100 ; 0,7) > N(70 : 4/21) 
i=1 npq =21 > 18 


80 — 0,5 - 70 
Jai 
) = FC 66 20 


Fm 
RQ 
Il 


P(Y2>80)=1-P(Y<80)= 1 | ) = 1-F,(2,07) = 1 —0,9808 = 0,192 


40 — 0,5 — 70 


PEN 


P(Y < 40) = Fo( 


Exercice 7.9 


1. X suit une loi exponentielle de paramètre 1 : E(X) = 1 et var(X) = 1 (cf. cours) 


EM)=2+X-EX)=2+X  var(}) = A2: var(X) = 2 


1— e-&-2)À siy>2 


Fly =Prœ<y=P(x<}22) = 
6)=PY<y= P(x<1 2) L _. 


La v.a. Y suit en fait une loi exponentielle de paramètres À et 0 = 2. 
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2.1. P(Y<2)= F2)=0 
PG£SY<S)= Fy5)- Fy2)=1- e-35= 0,45 


22. y*=2-5In(l- F) 


C2 + f =2-5*LN(1-E2) 


“& 
È 
Fa 

LD 
[=] 

= 

É 
E 

© 


Quantile théorique 


La loi exponentielle de paramètres À =5 et 0 = 2 est adaptée puisque le nuage des 
points (y7, y,;) est approximativement aligné le long de la première bissectrice. 


Exercice 7.10 


1 x =281 sy=9,375 


i Meszssass 029.566 
35-28 18 — 28 
1 PA8<X<35)=E _F, 
: GRR u( 9,5 ) u( 9,5 ) 


= F5(0,74) — Fy(- 1,05) = 0,7704 — 1 + 0,8531 = 62,35 % 
À partir de l’échantillon : 2 + 0,13/5 + 0,22 + 0,28 + 0,15 = 70,2 % 
A—28 
32. PX>A)=0175 = P(XSA)=025 = = us x = 0675 
A =28 —-9,5 - 0,675 = 28 —-6,4125 = 21,6 


A'=Q,=20+5-: 7 21,82  A'est le premier quartile 
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E2 v fé, =28+9,5*D2 


Quantile observé 


20 30 40 


Quantile théorique 


L'ensemble n’est pas trop éloigné de la bissectrice 
= iln’y a pas lieu de remettre l’ajustement en cause. 


Exercice 7.11 


0 sit<0 


t 
1. F0 = J fGu) du = 


t 

sfe "au = ter LE 
5 0 

0 


2. P(T>8)=1- F{8)=e #5 =e 16 x 0,202 
3.1. 1 si temps d’attente < 8 min p= 0,8 


i 


0 sinon g=0,2 


— est une somme de n v.a. indépendantes de Bernoulli de même paramètre 
p = 0,8 


n 
SY= SX, —> Hn;08) 
tr] 


3.2. E(Y)=08-n  var(Y)=0,16-n 
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4.1. 


4 0 en k _— n 
Z=Y+n n —. n+k _— 2n 
Probabilité 0,22 ( 0,8 0,2n-4 0,8" 


42. E(Z)=E(Y +n)=1,8-n  var(Z)=var(Y +n)=var()=0,16 -n 


Exercice 7.12 


| _xi Fi In(x i) 1-F; |in(-F;i) 
| 7 658 0,9 8,944 0,1 -2,303 
| 2087 0,8 7,643 0,2 -1,609 
1 691 0,7 7,433 0,3 -1,204 
1 585 06 7,368 0,4 -0,916 
1 505 0,5 7,317 0,5 -0,693 
1 291 0,4 7,163 0,6 -0,511 
1 266 0,3 7,144 0,7 -0,357 
1134 0,2 7,034 0,8 -0,223 
953 0,1 6,860 0,9 -0,105 
891 0,0 6,792 Î 0,000 


In(x ) 


p=-1,128x + 7,518 
r? = 0,883 


Calcul du coefficient de corrélation linéaire et des coefficients de la droite des moin- 
dres carrés avec Excel © : 

r = Coefficient corrélation (C2:C11;E2:E1) 

à = Index(Droitereg(E2:E11; C2:C11);1) 

b= Index(Droitereg(E2:E11; C2:C11);2) 


r=-0,94 = r étant voisin de 1, on peut considérer les 10 points approximati- 
vement alignés : In(1 — F;) = — 1,128 : In(x;) + 7,518 


Pour tracer avec Excel la droite des moindres carrés : onglet « Graphique », « Ajouter 
une courbe de tendance », type « Linéaire ». On peut utiliser ensuite l’onglet « Options » 
pour « Afficher l’équation sur le graphique » et pour « Afficher le coefficient de déter- 
mination (R?) sur le graphique ». 


2. La fonction de répartition d’une loi de Pareto est fonction de 2 paramètres © et Xp : 
Xo\* X0\% 
Fx(x) = 1- (+) = 1-F;Q)= (+) = In -F,()) = @:(In(xo) — In(x)) 
x x 
Les points {In(x;) ; In(1— F;)} étant quasi-alignés (r = — 0,94), l'ajustement de la dis- 


tribution par une loi de Pareto est justifié, et on peut évaluer ses paramètres 
a=1,128 In(x) = 6,667 — x = e6:667 786 
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Exercice 7.13 


1 ÿ,= 13:17 +135, 


Ê Nombre de contrats " : Résidus 
souscrits 2 : croissants 
1 117 136,8 — 19,8 — 29,3 
4 178 140,7 37,3 — 23,0 
9 149 147,2 1,8 — 19,8 
16 189 156,3 32,7 — 17,9 
25 145 168,0 — 23,0 — 9,3 
36 173 182,3 — 9,3 — 8,0 
49 170 199,3 — 29,3 1,8 
64 223 218,8 4,2 4,2 
81 223 240,9 — 17,9 15,3 
100 281 265,7 1533 16,0 
121 285 293,0 — 8,0 32,7 
144 339 323,0 16,0 37,3 


fe =22*C2 


09673  -213 
198 250 | 046745 | -148 
17,9 33,3 | 04308 | 9,5 
93 4,7 |-02103 | -46 |% 
80 50,0 | 0,0000 0,0 É 
18 583 | 0,103 46 8 
42 66,7 | 0,4308 9,5 3 do 50 -20 10 20 30 4 
15,3 750 | 06745 | 148 5 
16,0 833 | 09673 | 213 | © 
32,7 91,7 | 13832 | 304 


Quantile théorique 


Les points étant peu éloignés de la bissectrice, on ne rejette pas l’ajustement par la loi 
normale N° (0 ; 22). 


Exercice 7.14 
1. P(IX-m|<10) = P(-I0<X-m<10) = Fy(0/25) — Fy(-10/25) 
: (2Fy(0,4) —1) =2:-0,6554-1 = 0,3108 


2. X)$ = teneur moyenne en sucre des 25 bouteilles 
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25 
> X; = N (1750 ; 125) puisque les X; sont id à X de distribution N(70 ; 25) 
i=1 


(id pour « indépendantes et identiquement distribuées ») 


E(X;:) = E(X) var(X,:) = var(X)/25 = 25 
(cf. loi de la v.a. appelée moyenne empirique, chapitre 7, $ IIL.A). 
= X55 = N(70:5) P(IX-ml<10) = P(IX-ml<2 0%) =0,9544 
Teneur (g): x; F; (%) ü; 
4 11 -1,2265 
50 23 -0,7388 
60 40 -0,2533 
70 60 0,2533 
p = 20,2x +65 
80 77 0,7388 7° = 0,9999 
50 89 1,2265 
100 96 1,7507 


Les points (u;, x;) étant alignés, on a : x; = au;+b 
Les u, étant les fractiles d’une loi normale centrée-réduite, on a : u, = x;-m/6 


Les paramètres de la droite des moindres carrés sont donc des évaluations de la 
moyenne et de l’écart-type :  m*=65g et o*=20g 


Exercice 7.15 


1. Profondeur (Me) = 50,5 —=  Me=127 
Profondeur (Q) = 25,5 => Q,=107 Q;3=(144 + 146)/2 = 145 


Trois indicateurs de tendance centrale : 


Moyenne = 124,6 Me = 127 (Q, + Q3)/2 = 126 


Deux indicateurs de dispersion : 


sx = 32 EIQ = 38 


2.1 P(n-o<X<m +06)= Fy(l) - Fyt- 1) = 0,6826 


P(m -26 < X < m +20) = Fy(2) - Fyt- 2) = 0,9544 
33 
%—125 


P(X<xj) = 0,1 = Fi ) = 0,1=x,—125 = -30-1,2816 — x, = 86,552 
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Fu) 0,1 0,2 0,3 0,4 0,5 


u; —1,2816 | —-0,8416 | —-0,5244 | —0,2533 0 
X; = 30u;+ 125 86,6 99,8 109,3 117,4 125,0 
Fy(u;) 0,6 0,7 0,8 0,9 
u; 2,2533 0,5244 0,8416 1,2816 
X; = 30u;+ 125 192,6 140,7 150,2 163,4 
3. 
Valeur <X] Lx; Xl LP ; Xl 3 ; Xl Lx : Xl 
Effectif 12 5 10 10 10 
Valeur [xs : X6L [x6 : XL [47 : xel [8 ; Xol 2 Xo 
Effectif 16 5 10 14 8 
4. 
| Valeur 100. P(Y<x;)  F; (%) Diagramme Probabilité-Probabilité 
X1 10 12 
22 20 17 2 
X3 30 27 
X4 40 37 
X5 50 47 
X6 60 63 
X7 68 70 
Xe 80 78 
Xo 90 92 
O0 10 20 30 40 S0 60 70 80 90 100 
100. PCX <xi) 


1 
On a construit un diagramme Probabilité-Probabilité qui permet de comparer les proba- 
bilités cumulées théoriques aux fréquences cumulées. 


Les points sont quasi alignés sur la bissectrice, les pourcentages cumulés théoriques et 
observés sont très proches, l’ajustement de la distribution observée par la loi normale 
N° (125 ; 30) est retenu. 
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A nnexes 


I. Formulaire élémentaire de combinatoire 


Il. Principaux modèles de probabilités : 
méthodes de calculs 


[LE Introduction à la simulation 
des lois de probabilité 


IV. Tables 


I. Formulaire élémentaire de combinatoire 


Sous le nom de combinatoire, on regroupe 1ci les résultats essentiels de 
dénombrement sur les ensembles. 


A. Ensemble des parties d'un ensemble 


Soit À un ensemble de N éléments. L'ensemble P(A) des parties de À, 
comporte 2 éléments. 


B. Arrangements avec répétition 


On s'intéresse à un ensemble À de N éléments, dans lequel on sélectionne k 
individus, chacun pouvant être choisi plusieurs fois (tirages avec répétition). 
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Le nombre de sélections possibles de  k individus de À, par un tel procédé 
(ou encore d’arrangements avec répétition) est de : 


Nk 
En effet, pour le premier individu on a N choix possibles. Chacun de ces 


choix est associé à n’importe lequel des N choix possibles pour le second. On 
continue ainsi jusqu’au choix du dernier ( N possibilités également). 


C’est par exemple le cas, pour le nombre de résultats possibles pour une 
suite de N épreuves identiques ayant chacune les mêmes k résultats élémen- 
taires possibles. 


C. Permutations 


Soit À un ensemble de N éléments, on appelle permutation sur À une suite 
de N éléments de À. Ceci revient à dire que l’on a disposé  N objets de À 
dans un ordre déterminé. Il faut remarquer que dans cette définition générale, 
les objets peuvent ne pas être distincts. Pour cette raison, on introduit la 
notion de permutation sans répétition, dans laquelle les éléments de À sont 
distincts. Cette dernière définition revient donc à dire qu’une permutation 
(sans répétition) de À est un rangement particulier de ses éléments. 


Pour un ensemble À à N éléments il existe N : (N-1)-(N-2)-...-2.- 1 
permutations sans répétitions distinctes. Ce résultat est simple à montrer par 
récurrence. La valeur ainsi obtenue est appelée factorielle N, et elle est notée 


N! 
Plus généralement, si N;,, N;, N,4 sont les nombres de résultats distincts 


qui peuvent être obtenus sur k épreuves successives, alors le nombre de résul- 
tats distincts possibles à l’issue de la série des k épreuves est donné par : 


On peut montrer aisément qu’il existe NN permutations avec répétitions 
de N éléments. 


Dans ce qui suit on ne parlera que de permutation sans répétition. 


D. Arrangements sans répétition 


On se place donc encore dans le cas d’un ensemble À à N éléments distincts. Le 
nombre de choix possibles ordonnés de k objets de À est appelé nombre d’arran- 
gements sans répétition de k objets parmi N, et est désigné par AÂ.Ona : 


x _ _ N! 


Donne OPPOSER ES 
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En effet, après avoir choisi le premier élément ( N choix possibles), il ne 
reste plus que (N — 1) choix possibles pour le second. Chaque choix du premier 
peut être associé à n’importe lequel des choix du second, et on aW(N — 1) choix 
possibles pour les 2 premiers éléments sélectionnés. En poursuivant le rai- 
sonnement, on obtient le résultat annoncé. 

Soit ainsi une tombola dotée de 4 prix, pour laquelle 20 billets ont été 
émis et tous vendus. Le nombre de résultats posssibles correspond alors au 
nombre de choix possible de 4 individus (les 4 gagnants) parmi 20 (les 20 
possesseurs de billets), et l’ordre des gagnants est ici important puisque les 
prix sont distincts et de valeurs en général très différentes. On a 


4 20! 
20 16! 


situations différentes observables à l’issue du tirage de la tombola. 


= 17:18 : 19 : 20 = 116 280 


E. Combinaisons sans répétition 


Dans le cas précédent, l’ordre dans lequel se trouvent les  k individus sélec- 
tionnés dans l’ensemble À est important, et il convenait de distinguer deux 
sélections dans lesquelles les individus tirés seraient les mêmes mais ne 
seraient pas affectés aux mêmes positions (ou rangs de tirage). 

Nous considérons souvent aussi des cas où cet ordre n’a pas de significa- 
tion précise. Pour un ensemble À de N éléments dans lequel on sélectionne 
k individus sans répétition sans tenir compte de l’ordre, on désigne alors le 


nombre de choix possibles par 


k } qu’on appelle nombre de combinaisons 


de N individus pris k à k. 


On sait que tous les choix résultant aux mêmes k individus donneront 
donc une seule combinaison de k éléments pris parmi les N de À. Tous ces 
choix sont les permutations des k éléments, et il en existe K! 


Il en résulte que le nombre de combinaisons o ) est égal au nombre 
d’arrangements Af divisé par k!: 


(5) _ Ai _ __N! 
k)  k!  kKI(N-k)! 

Dans l’exemple précédent de la tombola à 20 billets vendus et 4 prix, si 
les prix étaient identiques, on parlerait de 


(Ce) 2 
4)" 41-16! 
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résultats possibles à l’issue du tirage (soit 4 ! = 24 fois moins que si les prix 
sont différents). 


Mentionnons quelques formules très utilisées relatives à ce nombre de 
combinaisons : 


Go) (Je (= 
Ge (GE) 


dont l’application très connue est le triangle de Pascal qui est un tableau 


ainsi que : 


triangulaire dont chaque ligne correspond à une valeur de N et chaque 
colonne à une valeur de k (k= 0, 1,2, , N). Sa construction se déduit de la 
formule ci-dessus. Ainsi pour les 8 premières lignes : 

1 

1 1 

12 =1 +1 1 

13 =2 +13= 1 +2 1 

14 =3 +16= 3+3 4= 14+3 I 

1 5 =4 +110= 6+4 10=4+6 5= 1+4 1 

16 =5 +115= 10+5 20=10+10 15=5+10 6= 1+5 1 
17 =6 +121= 15+6 35=20+15 35=15+20 21=6+15 7=-1+6 


en se rappelant que les extrêmes de chaque ligne sont toujours égaux à 1. 


Citons aussi la formule bien connue du binôme de Newton : 


(a+b)\ = >() db 


k=1 


dont un cas particulier est : 


obtenu en prenant a = let b=1. 


Enfin, on citera une formule de récurrence permettant de calculer les nom- 
bres de combinaisons par quelques pas de programme : 


(x) : (ou) 


On retrouve son application à l’annexe Il. 
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F. Coefficients multinomiaux 


Le nombre total de différents partages d’un ensemble à N éléments en k sous- 


ensembles disjoints, contenant respectivements n1,, ñ9,... , ny éléments est 
donné par le coefficient multinomial : 
N! 
nl:ml:...n! 


C’est une généralisation du nombre de combinaisons, é }: où l’on par- 


tageait l’ensemble À à N éléments en deux sous-ensembles, l’un de k élé- 
ments et l’autre des ( N — k) éléments restants. 


Il. Principaux modèles de probabilités : 
méthodes de calculs 


A. Lo: binomiale 


La formule donnant les probabilités individuelles d’une loi R(n, p) permet 
de construire une procédure itérative. En effet, si X suit une telle loi : 


P(X=k+ 1) = Fi j'a 2) Ds 


n! k+1 n—k-1 
Œ = 
ÉD + 2 


___ nl(n-k) = p}"* 
_ H&+ Dep ? (1-p) 


n! L n-k (n—k)p 
Hein PT Gé Dam 


= Mk) _p _p(x=p 
(Æ+TD)(1—p) 
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On écrira donc très facilement, à partir de la valeur P(X =0)=(1- p}", 
toutes les probabilités individuelles d’une loi binomiale, en multipliant la 
précédente par 


(n=k)p 
(&+1)(1—p) 
Partant d’une somme égale à  P(X = 0), on obtiendra les probabilités 
cumulées en ajoutant à chaque fois la nouvelle probabilité individuelle à la 
somme de l’étape précédente. 


B. Lo: de Poisson 


Ici encore, la formule des probabilités individuelles permet d’écrire une for- 
mule de calcul itératif (formule déjà présentée et utilisée au chapitre 6, $ I). 
Si Ÿ suit une loi P(m), on a la formule : 


m 


(+1) 


qui permet de programmer le calcul des probabilités individuelles, partant de 
P(Y = 0) =e-", La programmation du calcul des probabilités cumulées se 
fait comme pour celles de la loi binomiale, en additionnant la nouvelle pro- 
babilité individuelle à la somme de l’étape précédente, après avoir débuté la 
somme par P(Y = 0). 


P(Y=k+1)= P(Y=k) 


C. Lo: de Gauss centrée réduite 


Le calcul de valeurs de la fonction de répartition peut s’effectuer à l’aide de 
formules approchées. Les plus utiles sont les formules de Hastings. Simples 
à programmer, elles permettent d’obtenir la valeur de la fonction cumulative 
en un point u > 0. Pour la valeur de F,j(u) en un point u < 0, on se sert de 
légalité Fu) = 1 - Fy(u). Nous donnons deux formules. La seconde est 
plus simple, mais un peu moins précise que la première. 
a) Fy(u)=1-(a;z+a27?+ né) e ? dans laquelle : 
T 
ai = 0,4361836 a; = 0,1201676 a; = 0,9372980 


L 1 
FE 14033267a 


L'erreur commise est au plus égale à 0,00001. 
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b) 
Faÿ=1= 50 + 0,196854u + 0,115194u2 + 0,000344u3 + 0,019527u4)-4 


L'erreur commise est au plus égale à 0,00025. 


D. Loi du khi-deux 


On utilise la formule, vue au chapitre 7, $ IILA, de Wilson-Hilferty : 


1/3 
PGU(n)<x)=Fy () = “2)f 


la détermination de la valeur de la fonction de répartition de la loi de 
Gauss centrée réduite se faisant par l’une des formules données ci-dessus. 


E = Lo: de Student 


On a vu au chapitre 7, IILB, que la loi de Student à 2 ddl possède une fonction 
de répartition simple permettant des calculs exacts. Dans le cas général, on 
utilise deux formules d’approximation ; l’une pour la fonction de répartition, 
l’autre pour les fractiles. La première formule est due à Fisher et s’écrit, pour 
t>0 (pour { < 0, on utilise la symétrie) : 


l (L 1 1 1 
P(T, ,<t) = Fyft)-——e 2] =f(82+1)-+—1(316- 714 512-3)— 
(T,<t) u(t) a à, 96” V3 


+ L (po 11184 14164 6-3P- 151) 
384 


L'erreur commise est au plus égale à 0,000005. C’est donc une excellente 
approximation. 


Dans le cas particulier de la loi de Student à 1 ddl, on peut utiliser la for- 
mule suivante qui donne un résultat entaché d’une erreur au plus égale à 
0,001, mais qui ne nécessite pas de calcul de fonction de répartition de la loi 
normale. 
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PO<T <= {1-45 5) Si 0<1<£<0,5 


PO<T <= 243 (- DE DE »-(Ec- 1) 
si0,5<r<1 


PO<T,<n=3+i[i--L+ Lt) sir>1,5 
2 NE AP SP 7 

La formule suivante permet une approximation des fractiles de la loi de 
Student à partir de ceux de la loi de Gauss centrée réduite. Elle est due à 
Fisher et Cornish : 


1 2 1 
tv) = u +=u (2 + LS + 


1 4 
a*44o 4 (Su, + 16u 


: ÿ . 6 4 2 1 
Dc"o SE Gug + 19g + Mg = 15) 


+ 
a" 2 384 0 


F, Lo: de Fisher-Snedecor 


Pour cette loi, on peut utiliser la formule suivante, due à G.W. Cochran, et 
qui donne les fractiles d’une loi F(V;, V)) en fonction des fractiles de la loi 
normale centrée réduite : 


ane d(r+qué- D}nue(r Suis) 


où et a= (2-2) c= (142) 
2\v, v. 2\v, 


Cette formule est en fait dérivée de la formule de Wilson-Hilferty pour 
chaque loi de khi-deux au numérateur et au dénominateur de la loi de Fisher- 
Snedecor. On ne connait pas précisément de borne supérieure de l’erreur 
commise avec cette approximation, même si on peut considérer que cette 
approximation est de bonne qualité. 
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IlE. Introduction à la simulation 
des lois de probabilité 


A. La place des méthodes de simulation 


Les activités économiques sont tributaires de contraintes et d’influences com- 
plexes, sources de variation importantes sur la ou les grandeurs étudiées. 
Dans certains cas, on peut obtenir une solution analytique au fonctionnement 
d’un système complexe, mais le plus souvent il est nécessaire de recourir à 
l’étude de scénarii sous la forme d’une analyse de sensibilité, ou mieux 
encore à la simulation lorsque la partie aléatoire peut être décrite par des dis- 
tributions de probabilités. Ainsi, dans une modélisation de flux, la prise en 
compte des interactions de toutes sortes génère des modèles mathématiques 
délicats, de même que pour l’établissement de valeurs ( pricing), les calculs 
sont basés sur des modèles aléatoires dont la résolution complète n’est pas 
toujours nécessaire et/ou possible. 


Toutes les méthodes scientifiques de gestion ont bénéficié de l’explosion 
des ressources de calcul des ordinateurs, qui ont donné l’occasion d’une large 
diffusion des méthodes dites « intensives » comme la simulation. Les 
tableurs actuels sont tous munis d’un générateur de nombres « pseudo- 
aléatoires » de qualité suffisante pour la plupart des besoins courants. Avec 
la mise à disposition d’une bibliothèque de fonctions (mathématiques, statis- 
tiques, logiques, etc.), les méthodes de simulation sont devenues un ensemble 
d'outils d’aide à la décision très largement accessible et répandu. Quelques 
bibliothèques de programmes (comme le logiciel R) organisées autour d’un 
langage très simple complètent les instruments de base. 


B. Les principes de la simulation sur tableur 


Simuler est une façon d’imiter. Simuler le comportement d’un système com- 
plexe consiste à en reconstituer fictivement des réalisations. On parle de 
simulation aléatoire lorsque celles-ci sont obtenues à l’aide de réalisations 
fictives de variables aléatoires de distributions connues. 


Pour toute simulation, on part de réalisations « artificielles » de la distri- 
bution uniforme continue sur l’intervalle  ]0; 1[ quisont« fabriquées » 
(simulées) au travers de la fonction ALEA(). L'appel de cette fonction dans 
K cellules d’une feuille de tableur permet d’obtenir {x;,i = 1,...,K}, K réa- 
lisations indépendantes de la distribution uniforme continue sur ]0; 1[ 
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Pour obtenir des valeurs simulées de la distribution de Bernoulli de para- 
mètre p on utilise la fonction logique : 
SI ALEAO < p 
en affectant la valeur 1 comme résultat lorsque la condition est réalisée, et la 
valeur 0 sinon. 
En effet, la probabilité d’avoir un résultat de loi uniforme continue sur 
]0 ; 1[ inférieur à p est égale à p (chapitre 7, $ IA). 


C. Simulation de lois discrètes 


On peut obtenir une réalisation simulée d’une loi binomiale RB (n; pen 
simulant n réalisations de lois de Bernoulli de paramètre p comme on vient 
de voir, et en faisant la somme des résultats puisqu’une variable binomiale 
B (n; p) est une somme de n variables de Bernoulli indépendantes et de 
même paramètre p. On peut aussi simuler une distribution géométrique Æ(p) 
en simulant des réalisations de lois de Bernoulli de paramètre p jusqu’à 
l’obtention de la première valeur 1 

La simulation de valeurs issues d’une distribution de Poisson demande 
une assez bonne pratique de l’utilisation d’un tableur (avec macros). Elle peut 
aussi être obtenue à partir des propriétés de certains modèles simples de files 
d’attentel ; la méthode est évoquée à propos de la simulation de la loi expo- 
nentielle dans le paragraphe suivant. 


D. Simulations de lois continues 


Pour obtenir des réalisations simulées d’une distribution continue lorsque sa 
fonction de répartition est inversible on utilise le résultat donné à la fin du 
paragraphe sur la distribution uniforme (chapitre 7, $ LA) : si X est une varia- 
ble aléatoire continue dont la fonction de répartition  F est bijective (donc 
inversible), alors la variable aléatoire Y = F(X) a une distribution uniforme 
continue sur [0 ; 1[ 


En effet, X peut s’obtenir par X = F-!(Y) où Y est uniforme continue sur 
]0 ; 1[, donc pouvant être obtenue par l’appel à la fonction ALEA(. 

L’exemple de la distribution exponentielle est l’un des plus utilisés. La 
fonction de répartition de la distribution exponentielle de paramètres À et 6 
est donnée par : 


y = F(x) = 0 ee 
1—-exp(-(x-68)/À) six26 


Pour x > 6 on a x = 6 — Aln(1 — y) 


1. Cf. par exemple l’ouvrage de Dodge et Melfi en bibliographie. 
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Pour toute valeur de y, nombre pseudo-aléatoire généré par la fonction 
ALEA(, on obtient ainsi une valeur x d’une loi exponentielle par un calcul 
élémentaire. 

La simulation de valeurs issues de distributions exponentielles permet de 
simuler des systèmes de files d’attente générés par l’accès aléatoire d’utilisa- 
teurs à une ressource partagée (un guichet par exemple) où les intervalles 
entre deux arrivées successives sont distribués selon une loi exponentielle et 
où les temps d’utilisation de la ressource sont aussi distribués selon une loi 
exponentielle (files notées M/M/C)!. L'étude de ces files d’attente (ici M/M/1) 
permet de montrer que le nombre d’arrivées par intervalle de temps fixe est 
aléatoire et distribué selon une loi de Poisson. On retrouve donc ici une pos- 
sibilité de simuler des valeurs issues d’une loi de Poisson à partir de la simu- 
lation d’une file d’attente reposant sur des lois exponentielles. 

Pour obtenir des réalisations simulées d’une distribution continue avec 
une fonction de répartition non inversible, on doit recourir à des méthodes 
plus élaborées, telles que la méthode d’acceptation-rejet. Elles ne sont pas 
présentées ici, mais nous donnerons simplement deux méthodes très utilisées 
pour simuler des valeurs de lois de Gauss. 


Méthode 1 : faire la somme de 12 valeurs simulées de loi uniforme con- 
tinue sur ]0 ; 1[ obtenues avec la fonction ALEA(). Par application du théo- 
rème central limite (chapitre 7, $ ILE), la distribution de la somme de 12 
variables uniformes continues sur ]0 ; 1[ peut être approximée par une loi de 
Gauss N (6 ; 1), et on obtient une loi de Gauss centrée réduite en retranchant 
6 au résultat de cette somme de 12 valeurs de loi uniforme (il est conseillé 
de montrer ce résultat en exercice). 


Méthode 2 (Box et Müller) : simuler deux valeurs indépendantes x, et x, de 
loi uniforme continue sur ]0 ; 1[ avec la fonction ALEA(). On obtient ensuite 
deux valeurs indépendantes de loi de Gauss centrée réduite en calculant 


u, = ,J-2nx,: cos(27Tx;) 
u, = \ÿJ-2nx,: sin(27rx;) 


Pour obtenir une valeur simulée y d’une loi de Gauss N (m ; 6), il suffit 
d’avoir une valeur simulée # d’une loi de Gauss centrée réduite (par une des 
méthodes précédentes par exemple) et calculer y = G-u+m 


Les liens établis entre les différentes distributions continues montrent par 
exemple encore que pour obtenir une valeur simulée d’une distribution du Khi- 
deux à 2 degrés de libertés, il suffit de se donner deux valeurs simulées indé- 
pendantes de loi de Gauss centrée réduite et de faire la somme de leurs carrés. 
Or, en appliquant la méthode de Box et Müller en partant des valeurs x, et x; 


1. La lettre M fait référence au caractère sans mémoire ( memoryless) de cette distribution. 
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issues d’une loi uniforme continue sur ]0 ; 1[, on obtient deux valeurs indépen- 
, : PR TE à 2 
dantes u, et u, d’une loi de Gauss centrée réduite telles que w, +u; = -2Inx, 


La fonction ALEA() génère donc une valeur d’une distribution du Khi- 
deux à 2 degrés de liberté en calculant -2In(ALEA()) 


Le lecteur peut trouver ensuite comment simuler facilement des valeurs 
d’une loi de khi-deux à nombre pair de degrés de liberté. 


E « Quelques exemples et applications 


1) Simulation d’une loi binomiale 


La simulation de la loi binomiale est illustrée à partir du nombre de filles 
dans des classes de CP (ayant toutes 25 élèves), en supposant que la réparti- 
tion des enfants à la naissance est de 48 % de filles et de 52 % de garçons 
(estimations démographiques classiques). 


Dans ce cadre nous avons simulé ( cf. tableau 1) 12 classes de 25 élèves 
avec le tableur Excel. 


Tableau 1 — Simulation d’une loi (25 ; 0,48) 


€ EL) LL VAL LL = VE D LL Te AL |  EL L,EL  L, L  L ] ,  Tà 
1 [ages] o[o22s3| 1[ o4sst] of 00058 02202] 1[o4473[ 1[ ous] t1[os2ss] o[o2284| 1[o6307] o[o3345] i[os7s7] 0 
2 [ozsrs| 1[04583| 1[0093[ 1[o5404 0088] [ose] o[os4] o[osv7s] o[os22| of ooo4] t1[ocss| o[orcsæ] 0 
3 [ossal o[osso7] 1[06330| of o1078 os462] o[ose70] of o150| fosse] [04653 [0779] o] otre] 1033] 1 
4 [ox] [04892] of 03855] 1102055] 1] 0415] [08387] o[ 08322] °o[ 02903] 1] 02282] 1104420] 1 o[ 02394 1 
F [05560] 0 0.234 oser] t1[o7sos| o[oo47s| 1] owal 1[os6s7| o[o7ss7] o[o7424| o[osss| 0 
o[osss7] 0 01949 ot] 100302] 1] 0500] o[o2854| 1107303] o[o5457] o[os24] o[oso8] 0 
0[ 08509 0.239 02530] 1[04430[ [00304 [09534] o[os28s| o|o0324] 1] 08888 03591] 1 
0,844] 0 
3 1[ 08553 06549 08854] of ose] 1] 05301! o] 08401] of ots77] [00557] 1 o163[ 1 
10 0[ 03976 01590 04350] o[osw7] o[os3e] 1[oo6es] 1108854] o| 05385 06692] 0 
fi o[ 08036 06735 02284[ 1[00945[ 1[ owss] [04837] o[oss76] o| 00530 05491] 0 
[_of os] 0 01884[ 1 
o[ 06952] 0] 00102 02199 00486] 1[04476] 1[0,5840| of 01206] 1] 08853 0.6358[ 0 
o[ 05835] 0] 03775 04505 04045[ [01540] 1[03394[ o[oosss] 1[ 07774 0.0640[ 1 
il o7e2s| 0] 0,459 07377 04477] 1[oc4e] o[o7694| of os6s| of 02045 04242] 1 
[_1[ osts4] o[osrs7] of 06284[ 0] 0086] 1] 06001] 0] 01020] 1] 01825] 1 | 078] 0 
of 01081] 1] 00515 06817 o6ns] 0058] 0[03254[ 102995] 1] 01440] 1] 06095 k 03443] 0 
o[ 07535] 0] 0,3809 0.3407 ossss[ 1[oss70] of os67] o[o048s| 1104532] 1] 04516 08344] 0 
il os6ss| 0] 01325 0.9317 02403] 1[ o24n] [05323] ofloses] o| 06210] 0] 02659 03535] 1 
[o5s05[ 0] 02725] 1] o6to6] 0 oso6e] o[ 6332] o[\yssos| 0 ; 05350[ 0 
[osero] #o[or2s7] o[05420] #o[os27e] 0 \s204] o[ ares] 1 J 09174] 0 
o[ 06675] oo 2 0,3826 DE 8 } 00742] 1 
o[ onss] 1 8 osssr] o[o4045[ 1[o175[ [os] 1 J 0238] 1 
J [oresl of 04183 1] 05022] of 0.423] 0 J 01938 1 
1 0 02248] 1 
12 
30 [ moume |__ 12 1208 CHER D 
31 variance 6,24 6,08 
: nn 
33 


Colonne A : valeurs de la fonction ALEA() 


Colonne B : simulation de valeurs de loi de Bernoulli de paramètre 0,48 
par la fonction SI(AI < 0,48 ; 1 ; 0) dans la cellule BI, puis tirée vers le bas 
sur 25 lignes (croix en bas à droite de la cellule). 
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Colonnes Cet D,EetE,GetH,letJ,KetL,MetN,OetP,QetR,sS 
et T, U et V, W et X remplies de manière similaire aux colonnes A et B. 


Les colonnes B, D, EF, H, J, L, N, P,R,T, V et X contiennent chacune une 
suite de 25 valeurs (0 ou 1) réalisations de naissances simulées, et modélisent 
chacune une classe de CP de 25 enfants dont on obtient le nombre de filles 
en faisant la somme de la colonne. 


Ce nombre de filles est en théorie la somme de 25 aléas de Bernoulli 
indépendants de même paramètre 0,48 ; il est distribué selon une loi bino- 
miale (25 ; 0,48) 


La moyenne théorique (25 : 0,48 =12) et la variance théorique (25 : 0,48 
-0,52 = 6,24) sont comparées à la moyenne et à la variance des valeurs simu- 
lées (lignes 30 et 31 du tableaul). 


Il est aussi possible de simuler presque instantanément un jeu de pile ou 
face répété 5 000, 10 000 ou même 100 000 fois pour une pièce pipée ou pour 
une pièce non pipée, et d'observer la convergence des fréquences de pile vers 
la probabilité théorique imposée dans la simulation, ce qui illustre la loi des 
grands nombres. 


2) Simulation d’une loi exponentielle 


Le second exemple est celui des lois exponentielles. Dans les systèmes à file 
d'attente, une ressource en quantité disponible limitée (guichet, serveur infor- 
matique, imprimante, etc.) est soumise à des demandes qui peuvent excéder 
ses capacités de réponse instantanées. C’est bien entendu ce que chacun a 
déjà vécu et observé à la caisse d’un magasin, dans une station-service, aux 
guichets d’un service public, par exemple. 


Le modèle simple de file d’attente à une seule ressource en partage est 
celui où les demandes (ou arrivées) sont aléatoires, indépendantes, et arrivent 
séparées par des intervalles de temps distribués selon une loi exponentielle, 
les temps de service (réponses aux demandes) étant eux aussi distribués selon 
une loi exponentielle. 


Ces deux variables aléatoires (temps séparant deux demandes successives, 
temps de service) ont été simulées à l’aide des nombres pseudo-aléatoires 
d’Excel ; quelques calculs expliqués ci-dessous permettent de construire arri- 
vées et départs (par libération de la ressource), ainsi que les temps d’attente 
et le nombre de demandes en attente (longueur de la file). 


L’exemple choisi (cf. tableau 2), avec la minute pour unité de temps, est 
celui où les temps séparant les arrivées sont répartis selon une loi exponen- 
tielle de paramètre 1, et les temps de service sont répartis selon une loi expo- 
nentielle de paramètre 4/3. Autrement dit il y a en moyenne une demande par 
minute, et le temps de service moyen est de 0,75 minute, soit 45 secondes. 
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Ce modèle de file d’attente est noté M/M/1 (chaque M caractérisant la dis- 
tribution exponentielle memoryless), des délais inter-arrivées puis des temps 
de service). 


Tableau 2 — Simulation d’une file d’attente de type M/M/I pour 30 arrivées 


sn IC ED nES ere ne nenenre ni 


taux arrivées | il client intervalle [temps |débutS |duréeS libération at. file  longiile 
taux service 1, 05472! 0547! 0,547L 01253. 06725 0 
moy 2 clients | 1 | ï 6 03354 
service moyen , Ï À 0,8186 

[__ minute | | gé | 15769 
14667 
2,8935 
0,8945 
0,8064 
16741 
06382 
0,2782 
17573 
0,2044 
20154 
2,6272 
f714 20,418  0,4082 
12,482 20,82 3,8246 


_20| , 12,858 24,65 0,7542 
al! 13 0,0286 12,887/ 25,40! 16871 
_2| 20 26155, 15,503 27,09 34362 
_23! 21 14656 16,968/ 30,22: 0,6963 
2H) 22 0,0248  16,993/ 30,92 13071 
_25| 23 13572  18,350/ 32,83, 2,7643 
_26 | 24 06701, 19,020 35,59 21017 
_27| 25 0,3021! 19,922 37,69 0,5046 
_28 | 26 0,5964 20,519, 38,20: 0,7013 
_241| 27 15753 22094) 38,90: 13490 
_30! 28 10227 23,117, 40,853 1,3081 
| 29 2,0120/ 25129 42,761 0,1218 
31 30 2,3703 27,499 42883] 0,2321 
ail 

#] 

35 

æ 
+] 


Colonne D : numéro d’ordre de la demande (du client) qui arrive. 


Colonne E : temps séparant deux arrivées successives simulées à l’aide de 
la fonction : 


=-LN(I-ALEAO) 
Colonne : F dates réelles d’arrivées des demandes (des clients). 


Dans la première cellule de la colonne (F3), on place la valeur contenue 
en E3 


Dans la seconde cellule (F4), on additionne la date d’arrivée du précédent 
au temps écoulé jusqu’à l’arrivée du suivant : F4 = F3 + Ed 

Puis on réitère sur la suite de la colonne en tirant la cellule F4 vers le bas 
(croix en bas à droite de la cellule). 


Colonne H : durées des services simulés à l’aide de la fonction 
= (4/3)*LN(1-ALEA() 
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Colonne G : date de début du service du client, qui est 

— sa date d’arrivée si le guichet est libre à ce moment ; 

— ou bien égale à la date où le guichet est libéré par le client en cours de 
service 

G3 = F3, puis G4 = MAX(F4 ;13) 

et le reste de la colonne par progression selon les valeurs de la colonne I. 

Colonne I : date de libération du guichet (fin de service au client en cours). 
C’est la somme de la date de début de service et de la durée de service du 
client considéré 

13 = G3 + H3 et le reste de la colonne par progression 

Colonne J : temps d’attente égal à la date de début de service diminuée de 

la date d’arrivée 
J3 = G3 - F3 et le reste de la colonne par progression 

Colonne K : longueur de la file d’attente lorsqu'un client arrive, qui est 
égale au numéro d’ordre de ce client diminué du numéro d’ordre du client 
qui sera servi : 

— si le client qui arrive est servi tout de suite, cette longueur est nulle  ; 

— si le client qui est en cours de service est le précédent, la file sera de 

longueur 1, etc. 
K5 = DS - EQUIV(F5;:$G$3:G5;1) 

Cette procédure par simulation permet de comprendre l’influence des 
paramètres des lois exponentielles des temps entre demandes et des temps de 
service. 

En gardant constant le premier, on peut voir que l’augmentation du second 
(qui signifie que le temps de service moyen est diminué donc que le guichet 
se libère plus vite) entraîne des attentes moins longues et une file moins four- 
nie, alors que sa diminution (qui implique que le temps de service moyen est 
augmenté) allonge le temps d’attente moyen et la longueur de la file. Ces 
résultats peuvent être démontrés rigoureusement pour la file M/M/1, mais le 
recours à la simulation est parfois nécessaire pour évaluer le temps d’attente 
moyen, la longueur moyenne de la file, et comprendre le mécanisme et les 
conséquences d’un système impliquant une (ou plusieurs) file(s) d’attente. 


3) Simulation d’une loi de Gauss 


Nous avons déjà indiqué au $ D de cette annexe ( cf. méthode 1) que le théo- 
rème central limite (chapitre 7, $ ILE) justifiait l’utilisation de la somme de 

12 valeurs de la fonction ALEA() à laquelle on retranche 6 pour obtenir une 

valeur simulée de loi de Gauss centrée réduite. 


L’exemple du tableau 3 porte sur 100 valeurs simulées (dont nous mon- 
trons les 25 premières) et illustre la qualité de cette méthode de simulation à 
l’aide d’un diagramme Quantile-Quantile. 


Pour obtenir les quantiles théoriques, les valeurs simulées ont été triées 
par ordre croissant, et dans la colonne située à gauche on a porté le numéro 


ANNEXES e 349 


d’ordre de ce rangement (de 1 à 100) ; l’observation portant le numéro à est 
donc le quantile observé d’ordre i/100 

La colonne de droite donne le quantile théorique de ce même ordre par 
application de la fonction : 


= LOI NORMALE.STANDARD.INVERSE(Di/100) 


Tableau 3 — Simulation d’une loi de Gauss centrée réduite et calcul des quantiles théorique 


(3 [ D I E [ F I G I H ( 1 [ J | 

-233971976) -2.326347874 

1935647642) -2.052748911 

1904843002! 1880792608 

1894734582) -1750686071 

1807661612) -1644852627 

4168907906 1554773595 

4160564648) 1475791028 

4600562944|  -140507156 

1499071075) 1340755094 

1470268589 1281551566 

1347357655 12265282 

1345083913) -1174986792 

1222656196 1126391129 

4120990163) 1080319341 

1146216619) -103643338 

1108756007) -0.394457889 

4106809406) -0,954165253 

1046916254 -0,915365088 

1031896302) -0.877896295 
20) -0945761621 -0,841621234 

CHE 21] -0917504826| -0,806421247 
22) -0851227269| -0,772193214 
23) -0.803950429| -0,728846849 
24) -0.774842297| -0,706302563 
25) -0645920486. -0.67448975 


Pour la dernière valeur, on ne calcule pas LOILNORMALE.STAN- 
DARD.INVERSE(1) qui n’est pas défini, mais on choisit une valeur arbi- 
traire proche de 1, comme 0,995 ou 0,999 


=LOLNORMALE.STANDSRD.NVERSE(D15400) 


3 | Quantiles 
observés 


13 


Quantiles 
théoriques 


1 2 3 


-3 


Figure 1 - Diagramme Quantile-Quantile obtenu pour les 100 valeurs 
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Le diagramme Quantile-Quantile obtenu sur pour 100 valeurs ( cf. figure 1) 
justifie parfaitement l’utilisation de cette méthode de simulation pour obtenir 
des valeurs d’une loi de Gauss centrée réduite. Les valeurs peuvent servir 
ensuite pour toute situation concrète où un phénomène aléatoire est gouverné 
par une loi de Gauss. 


En effet, avec des valeurs simulées u; d’une loi de Gauss centrée réduite, 
on obtient des valeurs simulées y; d’une loi de Gauss quelconque N (m ; 6) 
en calculant y; =6 -u;+m 


Il en est de même pour la simulation d’une loi log-normale en partant 
d’une loi de Gauss. 


IV, Tables 


À l'exception de la table des fractiles de la loi du khi-deux, les tables suivan- 
tes sont extraites de l’ Aide-mémoire statistique (CISIA°CERESTA, 19990). 
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PROBABILITÉS CUMULÉES DE LA LOI BINOMIALE 


k=c 
Probabilités cumulées Pr (X < c) = DTA = p}"* 
k=0 


p=3% | p=4% | p=5% | p=6% | p=1% | p=8% p=10% 


» ES | ER 
> eo L 
womau swbrmo/|au a 


= © D D IJA Un Se CG 


= 


0 
1 
) 
3 
4 
5 
6 
7 
8 
9 
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PROBABILITÉS CUMULÉES DE LA LOI DE POISSON 


k 
_yn 


k=cC 
Probabilités cumulées Pr (X £c)= Ÿ'e 


mo  k! 


0,3679 
0,7358 
0,9197 
0,9810 
0,9963 


0,9994 
0,9999 
1 


\Q 00 -J tn BSD Oo 


mm nu mu mu 
+ © D = © 


pu 
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PROBABILITÉS CUMULÉES DE LA LOI DE POISSON (suite) 


Probabilités cumulées Pr (X < €) = Se” ui 
k=0 


0,0009 0,0001 0,000! 
0,0073 do A 0,0012 0.0008 
0,0296 0,0203 À ! 0,0062 0,0042 
00818 0,0591 J j 0,0212 0,0149 
0,1730 0,1321 il 0,0550 0,0403 


0,3007 0,2414 ; Ë 0,1157 0,0885 
0,4497 0,3782 h À 0,2068 0,1649 
0,5987 0,5246 R , 0,3239 0,2687 
0,7291 0,6620 , k 0,4557 0,3918 
0,8305 0,7764 À , 0,5874 0,5218 


0 
1 
2 
3 
4 
5 
6 
7 
8 
9 


0,9015 0,8622 k 0,7060 0,6453 
0,9466 0,9208 É j 0,8030 0,7520 
0,9730 0,9573 À Ë 0,8758 0,8364 
0,9872 0,9784 : À 0,9261 0,8981 
0,9943 0,9897 ; A 0,9585 0,9400 


0,9976 0,9954 h 0,9780 0,9665 
0,9990 0,9980 k j 0,9889 0,9823 
0,9996 0,9952 , A 0,9947 0,9911 
0,9999 0,9997 É ñ 0,9976 0,9957 
1 0,9999 | 0,9989 0,9980 


1 | h 0,9996 0,9991 
0,9998 0,9996 
0,9999 0,9998 
Î 0,9999 
1 
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NO 00 -J G Ua & LU D = © 


PROBABILITÉS CUMULÉES DE LA LOI DE POISSON (suite] 


0,0002 
0,0012 
0,0049 
0,0151 


0,0375 
0,0786 
0,1432 
0,2320 
0,3405 


0,4599 
0,5793 
0,6887 
0,7813 
0,8541 


0,9075 
0,9442 
0,9679 
0,9824 
0,9908 


0,9554 
0,9978 
0,9990 
0,9996 
0,9999 


1 


m=12 


0,0001 
0,0005 
0,0023 
0,0076 


0,0203 
0,0458 
0,0895 
0,1550 
0,2424 


0,3472 
0,4616 
0,5760 
0,6816 
0,7721 


0,8445 
0,8988 
0,9371 
0,9626 
0,9787 


0,9884 
0,9939 
0,9969 
0,9985 
0,9993 


0,9997 
0,9999 
1 


0,0002 
0,0010 
0,0037 


0,0107 
0,0259 
0,0540 
0,0997 
0,1658 


0,2517 
0,3532 
0,4631 
0,5730 
0,6751 


0,7636 
0,8355 
0,8905 
0,9302 
0,9574 


0,9751 
0,9860 
0,9925 
0,9962 
0,9982 


0,9992 
0,9997 
0,9999 
1 


0,0001 


0,0003 
0,0010 
0,0029 
0,0071 
0,0154 


0,0304 
0,0549 
0,0917 
0,1426 
0,2081 


0,2867 
0,3750 
0,4686 
0,5622 
0,6509 


0,7307 
0,7991 
0,8551 
0,8989 
0,9313 


0,9554 
0,9718 
0,9827 
0,9897 
0,9941 


0,9967 
0,9982 
0,9990 
0,9995 
0,9998 


0,9999 
l 
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FRACTILES DE LA LOI NORMALE RÉDUITE 


Cette table donne les valeurs absolues des fractiles,  u,, de la loi normale 
réduite tels que : 


Pour P < 0,5 (colonne de gauche et ligne supérieure) les fractiles u,, sont 
négatifs. 

Pour P > 0,5 (colonne de droite et ligne inférieure) les fractiles U,, SOnt 
positifs. 


ee 


2,5758 2,3263 
2; 3263 2,1701 2,0537 
2,0537 | 2, Le: ; ; 1,9600 | I, ; à ÿ 1,8808 
1,8808 | 1, ; ; ; 1,8119 | 1, ; ; ê 1,7507 
1,7507 | 1, : : à 1,6954 { 1, x j ; 1,6449 


1,6449 | 1, A J s 1,5982 | 1, 5805 | 1, ; 1,5548 
1,5548 | 1, : : % 1,5141 | 1, 5 ; É 1,4758 
1,4758 | I, | ‘ ; 14395 | 1, : ; $ 1,4051 
1,4051 | 1, ; : : 1,3722 | 1, A ; ; 1,3408 
1,3408 | 1,33 , \ ; 1,3106 | 1,3 À : ; 1,2816 


1,2816 | 1, ; ; 5 12536 | 1, ; ; A 1,2265 
1,2265 | 1, ï j ; 1,2004 | I, ; ; Ë 1,1750 
1,1750 | 1, : ; j 1,1503 | 1,1455 | 1, j Ë 1,1264 
1,1264 | 1, ; , ; 1,1031 { 1, j 1 À 1,0803 
1,0803 | 1, ï A ; 1,0581 | 1,05 ; 1 ; 1,0364. 


1,0364 | 1, ; } ; 10152 | 1, ; A : 0,9945 
0,9945 | O, ; h É 0,9741 | 0, , Ê ï 0,9542 
0,9542 | 0, ; ; , 0,9346 | 0,92 ; Â , 0,9154 
0,9154 | O, , Â È 0,8965 | 0, j A h 0,8779 
0.8779 | 0, A À À 0,8596 | 0,85 ; ; : 0,8416 


0,8416 | 0, k À , 0,8239 | 0, ; Ê h 0,8064 
0,8064 | O, À ; À 0,7892 | O, } ; , 0,7722 
0,7722 | O, h À | 0,7554 | 0,75 ; È É 0,7388 
0,7388 | 0,73 : F 0,7225 | G, À A : 0,7063 
0,7063 Â : ; 0,6503 | ©, k ; ; 0,6745 


0,6745 | 0, Ê ; Ë 0,6588 | 0,655 li ; À 0,6433 
0,6433 | 0, : j ; 0,6280 | O, , ! À 0,6128 
0,6128 | O, | ; ; 0,5978 | 0, , , : 0,5828 
0,5828 | 0, , ; ; 0,5681 F0, ; ; ,5563 | 0,5534 
0,5534 | ©, ; : 5 0,5388 | 0,53: , 5 É 0,5244 
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FRACTILES DE LA LOI NORMALE RÉDUITE (suite] 


(suite) 


DCE sn pu qu 


MCE SO 


Grandes valeurs de u 


4, 3,7190 4,2649 4,7534 5,1993 5,6120 5,9978 
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FONCTION DE RÉPARTITION DE LA LOI NORMALE RÉDUITE 


Cette table donne pour w 6 0, la valeur P = Fu) de la fonction de répar- 
tition de la loi normale réduite telle que 


u 1 _x? 
P = F(u) = [= 2 dx 
JA27 


Pour u <0 : P = F(u)=1- F(-u) 


A EE EEE CEE 


AN.B. La notation 0,9*03 , par exemple, équivaut à 0,99903 
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FRACTILES DE LA LOI DE STUDENT 


Cette table donne les valeurs des fractiles fP(v) de la loi de Student pour 
P > 0,60 


Pour les valeurs P < 0,40, on a fP(v) = f;_P(v) 


0,975 0,990 0,995 0,999 0,9995 


BP BR WU N = 


D ip ni mu 
Un BR © D 


16 
17 
18 
19 
20 


n © à © 
Un & & D 


© à D 
D Ia 


æ D 
S © 


ww © VU 
a À © 


ww 
ce 


B 
e 


vbœuIamu 
S00CSS 


N.B. Pour v > 40 , on pourra utiliser l’approximation suivante : 
3 
(up + up) 


fp(V) = Up + 
P(V)= up 4 


où west le fractile d’ordre P de la loi normale réduite. 
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FRACTILES DE LA LOI DU KHI-DEUX 


07 075 09 095 0975 099 0905 0,999 


00002 000! 0004 09016 0,102 0455 1074 132 2706 3841 502 6635 7,88 10,827 
0,020 0051 0,103 O211 0575 1.386 2408 277 4605 5,991 738 9,210 10.60 13,815 
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Lot anglais/français 


A 


Arithmetic mean —- Moyenne 
arithmétique 


B 


Bernoulli trial - Épreuve de Bernoulli 

Binomial distribution — Loi binomiale 

Box plot- Boîte de distribution, boîte à 
moustache, boîte à pattes 

Box-and-whisker plot — Boîte de 
distribution, boîte à moustaches, 
boîte à pattes 


C 


Categorical variable — Variable 
qualitative, variable nominale 

Centered random variable — Variable 
aléatoire centrée 

Central limit theorem — Théorème 
central-limite 

Coefficient of kurtosis — Coefficient 
d’aplatissement 

Coefficient of skewness — Coefficient 
d’asymétrie 

Coefficient of variation — Coefficient 
de variation 

Composite index number — Indice 
synthétique 

Conditional frequency — Fréquence 
conditionnelle 

Correlation coefficient- Coefficient de 
corrélation 


Concentration index — Indice de 
concentration 

Conditional distribution — Distribution 
conditionnelle 

Conditional probability — Probabilité 
conditionnelle 

Contingency table — Tableau de 
contingence 

Continuous random variable — 
Variable aléatoire continue 

Convergence in distribution — 
Convergence en loi 

Convergence in second-order mean — 
Convergence en moyenne 
quadratique 

Convergence in probability — 
Convergence en probabilité 

Correlation ratio — Rapport de 
corrélation 

Covariance — Covariance 

Cumulative function — Fonction 
cumulative 

Cumulative frequency — Effectif 
cumulé 

Cumulative frequency curve — Courbe 
cumulative 

Cumulative distribution function — 
Fonction de répartition 


D 


Decile — Décile 

Degree of freedom — Degré de liberté 

Depth — Profondeur 

Discrete random variable — Variable 
aléatoire discrète 


Dummy variable — Variable indicatrice 
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E 


Equally probable - Équiprobabilité 
Equiprobability — Équiprobabilité 
Exhaustive sampling— Tirage exhaustif 


Expected value - Espérance 
mathématique 


Exponential smoothing — Lissage 
exponentiel 


F 


Forecasting — Prévision 
Frequency - Effectif 


Frequency distribution — Distribution 
observée 


Frequency table — Tableau de 
fréquence 


G 


Gaussian distribution — Loi de Gauss 

Geometric distribution — Loi 
géométrique 

Geometric mean —- Moyenne 
géométrique 


H 


Harmonic mean - Moyenne 
harmonique 


Histogram — Histogramme 


Independence -— Indépendance 
Index number — Indice élémentaire 
Individual — Individu 


Interquartile range — Intervalle 
interquartile 


L 


Law of large numbers- Loi des grands 
nombres 


Least-squares regression line — Droite 
des moindres carrés 


Line chart - Diagramme en bâtons 


M 


Marginal distribution — Distribution 
marginale 

Median —- Médiane 

Mean —- Moyenne 


Mean absolute error of prediction — 
Erreur absolue moyenne de prévision 


Mean deviation — Écart absolu moyen 

Mean square error of prediction — 
Erreur quadratique moyenne de 
prévision 

Measure of location — Indicateur de 
position 

Measure of shape — Indicateur de 
forme 

Measure of skewness — Indicateur 
d’asymétrie 

Measure of variability — Indicateur de 
dispersion 

Modality - Modalité 

Mode -— Mode 

Moving average — Moyenne mobile 

Moving median — Médiane mobile 


N 


Normal distribution — Loi normale 


O 


Observation — Observation 


Ouilier — Valeur éloignée, valeur 
extrême 
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P 


Pair of random variables — Couple de 
variables aléatoires 


Percentile — Centile 

Pie chart - Diagramme circulaire 
Population — Population 
Probability — Probabilité 


Probability density function- Fonction 
de densité de probabilité 


Probability distribution — Loi de 
probabilité 


Q 


Quantile — Quantile, fractile 


Quantile-Quantile plot - Diagramme 
Quantile-Quantile 


Quartile — Quartile 


Quantitative variable — Variable 
quantitative 


R 


Random component - Composante 
aléatoire 


Random experiment — Expérience 
aléatoire 


Random variable — Variable aléatoire 
Range — Étendue 


Regression curve — Courbe de 
régression 


Relative frequency — Fréquence 
Response category —- Modalité 


S 


Sample — Échantillon 

Sample space — Ensemble fondamental 

Sampling without replacement- Tirage 
exhaustif 

Scatter plot - Graphique de dispersion 

Seasonal component - Composante 
saisonnière 

Seasonally adjusted data — Données 
corrigées des variations saisonnières 

Skewness — Asymétrie 

Standard deviation — Écart-type 

Standard normal distribution — Loi 
normale centrée réduite 


Standardized normal distribution Loi 
normale centrée réduite 


Standardized random variable — 
Variable aléatoire centrée-réduite 


Statistical unit — Unité statistique 
Stem and leaf diagram — Diagramme 
« branche et feuille » 


T 


Time series — Chronique, série 
chronologique 
Trend - Tendance à long terme 


U 


Uniform distribution — Loi uniforme 


V 


Variance — Variance 


LEXIQUE ANGLAIS/FRANÇAIS © 365 


© Dunod. La photocopie non autorisée est un délit. 


Los français/anglais 


A 


Asymétrie — Skewness 


B 


Boîte de distribution — Box plot, box- 
and-whisker plot 

Boîte à moustaches — Box plot, box- 
and-whisker plot 

Boîte à pattes — Box plot, box-and- 
whisker plot 


C 


Centile — Percentile 

Chronique — Time series 

Coefficient d’aplatissement — 
Coefficient of kurtosis 

Coefficient d’asymétrie — Coefficient 
of skewness 

Coefficient de corrélation — 
Correlation coefficient 

Coefficient de variation — Coefficient 
of variation 

Composante saisonnière — Seasonal 
component 

Composante aléatoire - Random 
component 

Convergence en loi - Convergence in 
distribution 

Convergence en moyenne quadratique 
— Convergence in second-order 
mean 

Convergence en probabilité — 
Convergence in probability 


Couple de variables aléatoires —Pair of 
random variables 

Courbe cumulative — Cumulative 
frequency curve 

Courbe de régression — Regression 
curve 

Covariance — Covariance 


D 


Décile — Decile 

Degré de liberté — Degree of freedom 

Diagramme « branche et feuille » — 
Stem and leaf diagram 

Diagramme circulaire — Pie chart 

Diagramme en bâtons — Line chart 

Diagramme Quantile-Quantile — 
Quantile-Quantile plot 

Distribution conditionnelle — 
Conditional distribution 

Distribution marginale — Marginal 
distribution 

Distribution observée — Frequency 
distribution 

Droite des moindres carrés — Least- 
squares regression line 


E 


Écart absolu moyen — Mean deviation 

Écart-type — Standard deviation 

Échantillon — Sample 

Effectif — Frequency 

Effectif cumulé — Cumulative 
frequency 

Ensemble fondamental — Sample space 
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Épreuve de Bernoulli — Bernoulli trial 

Équiprobabilité — Equiprobability, 
equally probable 

Erreur absolue moyenne de prévision — 
Mean absolute error of prediction 

Erreur quadratique moyenne de 
prévision — Mean square error of 
prediction 

Espérance mathématique — Expected 
value 

Étendue — Range 

Expérience aléatoire — Random 
experiment 


F 


Fonction cumulative — Cumulative 
function 

Fonction de densité de probabilité — 
Probability density function 

Fonction de répartition — Cumulative 
distribution function 

Fractile — Quantile 

Fréquence — Relative frequency 

Fréquence conditionnelle — 
Conditional frequency 


G 


Graphique de dispersion — Scatter plot 


H 


Histogramme — Histogram 


Indépendance — /ndependence 

Indicateur d’asymétrie - Measure of 
skewness 

Indicateur de dispersion — Measure of 
variability 


Indicateur de forme — Measure of 
shape 

Indicateur de position - Measure of 
location 

Indice de concentration — 
Concentration Index 

Indice élémentaire — Index number 

Indice synthétique — Composite index 
number 

Individu — Individual, observation 

Intervalle interquartile — ]nterquartile 
range 


L 


Lissage exponentiel - Exponential 
smoothing 

Loi binomiale — Binomial distribution 

Loi de Gauss — Gaussian distribution 

Loi de probabilité — Probability 
distribution 

Loi des grands nombres —-Law of large 
numbers 

Loi géométrique — Geometric 
distribution 

Loi normale — Normal distribution 

Loi normale centrée réduite — 
Standardized normal distribution, 
standard normal distribution 

Loi uniforme — Uniform distribution 


M 


Médiane — Median 

Médiane mobile —- Moving median 

Modalité - Modality, response 
category 

Mode — Mode 

Moyenne — Mean 

Moyenne arithmétique — Arithmetic 
mean 

Moyenne géométrique — Geometric 
mean 
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Moyenne harmonique — Harmonic 
mean 
Moyenne mobile —- Moving average 


P 


Population — Population 
Prévision — Forecasting 
Probabilité — Probability 
Probabilité conditionnelle — 
Conditional probability 
Profondeur — Depth 


Q 


Quantile — Ouantile 
Quartile — Quartile 


R 


Rapport de corrélation — Correlation 
ratio 


S 


Série chronologique — Time series 

Série corrigée des variations 
saisonnières — Seasonally adjusted 
series 


T 


Tableau de contingence -Contingency 
table 


Tableau de fréquence — Frequency 
table 


Tendance à long terme — Trend 


Théorème central-limite -Central limit 
theorem 


Tirage exhaustif — Exhaustive 
sampling, sampling without 
replacement 


U 


Unité statistique — Sfatistical unit 


V 


Valeur éloignée — Outlier 
Valeur extrême — Outlier 
Variable aléatoire — Random variable 


Variable aléatoire centrée — Centered 
random variable 


Variable aléatoire centrée-réduite — 
Standardized random variable 


Variable aléatoire continue — 
Continuous random variable 


Variable aléatoire discrète — Discrete 
random variable 


Variable indicatrice — Dummy variable 


Variable nominale - Categorical 
variable 


Variable quantitative — Quantitative 
variable 


Variable qualitative — Categorical 
variable 


Variance — Variance 
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| ndex 


A 


Algèbre de Boole 134 

Analyse 270 

Approximation 203, 236, 239 
Arrangement avec répétition 335 
Arrangement sans répétition 336 
Asymétrie 27 


Bayes 139 

Binôme de Newton 338 
Boîte à moustaches 33 
Boîte de dispersion 33 
Boîte de distribution 33, 34 
Boîte-à-pattes 33 

Box-plot 33 


Chronique 103 

Chronologique 103 

Circularité 48 

Coefficient d’aplatissement 28, 164 

Coefficient d’association 91 

Coefficient d’asymétrie 28, 164 

Coefficient de corrélation linéaire 74, 
162 

Coefficient de variation 29 

Coefficient multinomial 339 

Coefficient saisonnier 113, 114 

Combinaison sans répétition 337 

Concentration 30 

Condition de Yule 13 


Convergence 166 
en loi 166 
en moyenne quadratique 168 
en probabilité 167 
faible 166 
Couple de variables aléatoires 151 
Courbe cumulative 9 
Courbe de concentration 30 
Courbe de Lorenz 30 
Courbe de régression 89 
Covariance 73, 162 


D 
Décile 22 
Déflater 56 
Degré de liberté 255 


Densité de probabilité 147 
Diagramme « branche et feuille » 12 
Diagramme en « camembert » 3 
Diagramme en bâtons 5 
Diagramme quantile-quantile 233 
Dispersion relative 29 
Distribution conditionnelle 69 
Distribution conjointe 67, 152 
Distribution marginale 69 
Distribution statistique 7 

Droite des moindres carrés 75 


E 


Écart absolu moyen 24 
Ecart-type 24, 160 
Écart-type conditionnel 70 
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Échantillon 1, 185 

Échelle logarithmique 59 

Effectif 4 

Effectif cumulé 8 

Ensemble fondamental 133 

Équiprobabilité 134 

Erreur absolue moyenne de prévision 
123 

Erreur quadratique moyenne de 
prévision 123 

Espace probabilisé 135 

Espérance conditionnelle 158 

Espérance mathématique 156 

Étendue 23 

Étendue interquartile 23 

Événement 133 

Événement certain 133 

Événement impossible 133 

Événement indépendant 138 

Expérience aléatoire 132 

Expérience déterministe 132 


F 


Facteur d’exhaustivité 192 
Fonction cumulative 9 


Fonction de répartition 9, 144, 151, 154 


Fonction de variable aléatoire 149 
Fonction génératrice des moments 163 
Formule 341 

Formule de Hastings 340 

Formule de Wilson-Hilferty 245 
Fractile 165 

Fréquence 4 

Fréquence conditionnelle 69 
Fréquence cumulée 8 


H 


Histogramme 6 


I 


Incompatibilité 133 
Indépendance 153 


Indépendance statistique 71 

Indicateur de dispersion 23, 165 

Indicateur de forme 165 

Indicateur de tendance centrale 14, 
156, 165 

Indice de concentration 32 

Indice de Fisher 54 

Indice de Gini 32 

Indice de Laspeyres 51 

Indice de Paasche 52 

Indice des prix 58 

Indice élémentaire 47 

Indice synthétique 49 

Indice-chaîne 57 

Individu 1 

Inégalité de Bienaymé-Tchébychev 
167 

Interquartile relatif 29 

Intervalle modal 18 

Irrégularité 104 


Kolmogorov 135 


L 


Lissage exponentiel double 125 

Logit 270 

Loi binomiale 185 

Loi binomiale en proportion 188 

Loi conditionnelle 152 

Loi d’Erlang 218 

Loi de Bernoulli 182 

Loi de Cauchy 247 

Loi de Fisher-Snedecor 252 

Loi de Pareto 260 

Loi de Pascal 193 

Loi de Poisson 199 

Loi de probabilité d’une variable 
aléatoire continue 146 

Loi de probabilité d’une variable 
aléatoire discrète 144 
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Loi de Student 247 

Loi de Weibull 218 

Loi du khi-deux 240 

Loi exponentielle 214 

Loi faible des grands nombres 170 

Loi forte des grands nombres 170 

Loi géométrique 193 

Loi hypergéométrique 192 

Loi logistique 268 

Loi log-normale 256 

Loi marginale 152 

Loi normale centrée réduite 219 

Loi normale ou loi de Laplace-Gauss 
219 

Loi uniforme continue 211 

Loi uniforme discrète 183 


Médiane 19, 165 

Médiane mobile 115 
Mesure 91 

khi-deux 91 

Mesure de probabilité 135 
Méthode de lissage exponentiel 120 
Modalité 2 

Mode 17, 156 

Modèle 179 

Modèle continu 180 
Modèle discret 180 
Modèle empirique 180 
Modèle théorique 180 
Moment 163 

Moment centré 27, 163 
Moment factoriel 163 
Mouvement saisonnier 104 
Moyenne 156 

Moyenne arithmétique 14 
Moyenne conditionnelle 70 
Moyenne empirique 237 
Moyenne géométrique 16 
Moyenne harmonique 17 
Moyenne mobile 109 


P 


Paradoxe de Bertrand 141 
Paradoxe de St Petersbourg 141 
Permutation 336 

Perturbation 104 

Population 1 

Probabilité 135 

Probabilité a posteriori 140 
Probabilité a priori 140 
Probabilité conditionnelle 136, 152 
Probit 270 

Profil en colonne 71 

Profil en ligne 71 

Profondeur 10 


Quantile 21, 165 
Quartile 21 


R 


Rapport de corrélation 87 
Règle de Laplace 134 
Réversibilité 48 


6-algèbre 134 
Schéma binomial 186 
Schéma de Bernoulli 181 
Série corrigée des variations 
saisonnières 113, 114 
Simulation 343 
d’une loi binomiale 346 
d’une loi de Gauss 349 
d’une loi exponentielle 347 
Slutsky-Yule 111 
Somme des Carrés Expliquée 79 
Somme des Carrés Interclasse 87 
Somme des Carrés Intraclasse 87 
Somme des Carrés Résiduelle 77 
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Somme des Carrés Totale 77, 87 


T 


Tableau de contingence 68 
Tableau des profils en colonne 71 
Tableau des profils en ligne 71 
Tendance à long terme 103 
Théorème central-limite 236 
Théorème des probabilités totales 136 
Tirage exhaustif 191 

Transitivité 48 

Trend 103 

Triangle de Pascal 338 

Tukey 3, 10 


U 


Unité statistique 2 


V 


Valeur éloignée 34, 36 
Valeur extrême 34 
Variable 2 

qualitative 2 

quantitative 2 
Variable aléatoire 142 
Variable aléatoire centrée 158 
Variable aléatoire indicatrice 182 
Variable aléatoire réduite 162 
Variable générique 185 
Variable parente 185 
Variable statistique continue 6 
Variable statistique discrète 4 
Variance 24, 160 


W 


Wilson-Hilferty 341 


